Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Building of a Vocabulary for the Automatic Voice-Dictation System

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F46747885%3A24310%2F03%3A00000064" target="_blank" >RIV/46747885:24310/03:00000064 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Building of a Vocabulary for the Automatic Voice-Dictation System

  • Popis výsledku v původním jazyce

    The article describes a process of creation of a large (800K) vocabulary for a voice-dictation system in Czech language. Such a lexicon has special features different from a lexicon intended for text processing because its look-up entry is a phonetic rather than textual form of a word. It should contain most words and word-forms occurring in standard (non-colloquial) spoken language, it should include separate entries for identical written forms if they are pronounced in different way and, on the otherhand, it can omit different spelling variations of the same word. The main goal of this study is to propose and compare various strategies of compiling such a large-scale Czech vocabulary with the aim to keep it as small as possible and at the same timeto ensure that it covers the maximum of some in advance unknown text.

  • Název v anglickém jazyce

    Building of a Vocabulary for the Automatic Voice-Dictation System

  • Popis výsledku anglicky

    The article describes a process of creation of a large (800K) vocabulary for a voice-dictation system in Czech language. Such a lexicon has special features different from a lexicon intended for text processing because its look-up entry is a phonetic rather than textual form of a word. It should contain most words and word-forms occurring in standard (non-colloquial) spoken language, it should include separate entries for identical written forms if they are pronounced in different way and, on the otherhand, it can omit different spelling variations of the same word. The main goal of this study is to propose and compare various strategies of compiling such a large-scale Czech vocabulary with the aim to keep it as small as possible and at the same timeto ensure that it covers the maximum of some in advance unknown text.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

    JD - Využití počítačů, robotika a její aplikace

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    Z - Vyzkumny zamer (s odkazem do CEZ)

Ostatní

  • Rok uplatnění

    2003

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    Text, Speech and Dialogue - 6th International Conference, TSD 2003 České Budějovice, Czech Republic, September 2003 Proceedings

  • ISBN

    3-540-20024-X

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    8

  • Strana od-do

    301

  • Název nakladatele

    Springer-Verlag

  • Místo vydání

    Heidelberg

  • Místo konání akce

    České Budějovice

  • Datum konání akce

    3. 9. 2003

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku