Vše
Vše

Co hledáte?

Vše
Projekty
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Anotace strukturálních metadat: za hranice angličtiny

Popis výsledku

Cílem extrakce metadat (MDE) je vyvinout technologii, která výstup ze "speech-to-text" systému automaticky zpracuje do formy, která je vhodnější pro následné zpracování. Roku 2003 byl úkol anotace strukturálních metadat v řeči definován pro angličtinu vrámci projektu DARPA EARS. Významnou výzvou je přidání nových jazyků. Tento článek popisuje snahu aplikovat MDE anotaci na data ve 3 velmi rozdílných jazycích: mandarinské čínštině, levantské arabštině a hovorové češtině.

Klíčová slova

spontaneous speechspeech corpusstrutural metadata

Identifikátory výsledku

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Structural metadata annotation: moving beyond English

  • Popis výsledku v původním jazyce

    The goal of metadata extraction (MDE) is to enable technology that can take raw speech-to-text output and refine it into forms that are more useful to humans and to downstream automatic processes. Starting in 2003, a structural metadata annotation task was defined for English as part of the DARPA EARS Program. A significant challenge for MDE is the addition of new languages. This paper reports on work undertaken to apply MDE annotation to data from three very different languages: Mandarin Chinese, Levantine Arabic, and conversational Czech. Details of annotation task modifications are provided for each language, along with a general overview of data and annotation tools for non-English MDE.

  • Název v anglickém jazyce

    Structural metadata annotation: moving beyond English

  • Popis výsledku anglicky

    The goal of metadata extraction (MDE) is to enable technology that can take raw speech-to-text output and refine it into forms that are more useful to humans and to downstream automatic processes. Starting in 2003, a structural metadata annotation task was defined for English as part of the DARPA EARS Program. A significant challenge for MDE is the addition of new languages. This paper reports on work undertaken to apply MDE annotation to data from three very different languages: Mandarin Chinese, Levantine Arabic, and conversational Czech. Details of annotation task modifications are provided for each language, along with a general overview of data and annotation tools for non-English MDE.

Klasifikace

  • Druh

    Jx - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)

  • CEP obor

    JD - Využití počítačů, robotika a její aplikace

  • OECD FORD obor

Návaznosti výsledku

Ostatní

  • Rok uplatnění

    2005

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    Eurospeech

  • ISSN

    1018-4074

  • e-ISSN

  • Svazek periodika

    2005

  • Číslo periodika v rámci svazku

  • Stát vydavatele periodika

    PT - Portugalská republika

  • Počet stran výsledku

    4

  • Strana od-do

    1545

  • Kód UT WoS článku

  • EID výsledku v databázi Scopus

Základní informace

Druh výsledku

Jx - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)

Jx

CEP

JD - Využití počítačů, robotika a její aplikace

Rok uplatnění

2005