Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Experiments with the recognition of highly inflected spoken language (czech) in the large vocabulary task

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F01%3A00065617" target="_blank" >RIV/49777513:23520/01:00065617 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Experiments with the recognition of highly inflected spoken language (czech) in the large vocabulary task

  • Popis výsledku v původním jazyce

    This paper presents three annotated and phonetically transcribed large speech corpora developed for spoken Czech. All corpora were collected during the last two years at the Department of Cybernetics, University of West Bohemia (UWB) in Pilsen. The firsttwo collections are broadcast news, the third corpus is a high-quality read-speech database. This paper describes the collection conditions, annotation and phonetic transcription process related to each corpus. The basic phonetic and lexical characteristics of all corpora will be given and compared mutually. Moreover the paper deals with problems encountered in large vocabulary continuous speech recognition of highly inflectional languages. The concept of morpheme-based language modeling is introducedand speech recognition results using word-based and morpheme-based language models are also reported.

  • Název v anglickém jazyce

    Experiments with the recognition of highly inflected spoken language (czech) in the large vocabulary task

  • Popis výsledku anglicky

    This paper presents three annotated and phonetically transcribed large speech corpora developed for spoken Czech. All corpora were collected during the last two years at the Department of Cybernetics, University of West Bohemia (UWB) in Pilsen. The firsttwo collections are broadcast news, the third corpus is a high-quality read-speech database. This paper describes the collection conditions, annotation and phonetic transcription process related to each corpus. The basic phonetic and lexical characteristics of all corpora will be given and compared mutually. Moreover the paper deals with problems encountered in large vocabulary continuous speech recognition of highly inflectional languages. The concept of morpheme-based language modeling is introducedand speech recognition results using word-based and morpheme-based language models are also reported.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

    JD - Využití počítačů, robotika a její aplikace

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LN00A063" target="_blank" >LN00A063: Centrum komputační lingvistiky</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)

Ostatní

  • Rok uplatnění

    2001

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    Experiments with the recognition of highly inflected spoken language (czech) in the large vocabulary task

  • ISBN

    9800775463

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    1

  • Strana od-do

  • Název nakladatele

    Neuveden

  • Místo vydání

    Orlando

  • Místo konání akce

    Neuveden

  • Datum konání akce

    1. 1. 2001

  • Typ akce podle státní příslušnosti

    CST - Celostátní akce

  • Kód UT WoS článku