All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Structural metadata annotation: moving beyond English

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F05%3A00000154" target="_blank" >RIV/49777513:23520/05:00000154 - isvavai.cz</a>

  • Alternative codes found

    RIV/49777513:23520/05:00000155

  • Result on the web

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    angličtina

  • Original language name

    Structural metadata annotation: moving beyond English

  • Original language description

    The goal of metadata extraction (MDE) is to enable technology that can take raw speech-to-text output and refine it into forms that are more useful to humans and to downstream automatic processes. Starting in 2003, a structural metadata annotation task was defined for English as part of the DARPA EARS Program. A significant challenge for MDE is the addition of new languages. This paper reports on work undertaken to apply MDE annotation to data from three very different languages: Mandarin Chinese, Levantine Arabic, and conversational Czech. Details of annotation task modifications are provided for each language, along with a general overview of data and annotation tools for non-English MDE.

  • Czech name

    Anotace strukturálních metadat: za hranice angličtiny

  • Czech description

    Cílem extrakce metadat (MDE) je vyvinout technologii, která výstup ze "speech-to-text" systému automaticky zpracuje do formy, která je vhodnější pro následné zpracování. Roku 2003 byl úkol anotace strukturálních metadat v řeči definován pro angličtinu vrámci projektu DARPA EARS. Významnou výzvou je přidání nových jazyků. Tento článek popisuje snahu aplikovat MDE anotaci na data ve 3 velmi rozdílných jazycích: mandarinské čínštině, levantské arabštině a hovorové češtině.

Classification

  • Type

    J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)

  • CEP classification

    JD - Use of computers, robotics and its application

  • OECD FORD branch

Result continuities

  • Project

    <a href="/en/project/LC536" target="_blank" >LC536: Integrated center for natural language processing</a><br>

  • Continuities

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)

Others

  • Publication year

    2005

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Name of the periodical

    Eurospeech

  • ISSN

    1018-4074

  • e-ISSN

  • Volume of the periodical

    2005

  • Issue of the periodical within the volume

  • Country of publishing house

    PT - PORTUGAL

  • Number of pages

    4

  • Pages from-to

    1545

  • UT code for WoS article

  • EID of the result in the Scopus database