Experiments with the recognition of highly inflected spoken language (czech) in the large vocabulary task
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F01%3A00065617" target="_blank" >RIV/49777513:23520/01:00065617 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Experiments with the recognition of highly inflected spoken language (czech) in the large vocabulary task
Popis výsledku v původním jazyce
This paper presents three annotated and phonetically transcribed large speech corpora developed for spoken Czech. All corpora were collected during the last two years at the Department of Cybernetics, University of West Bohemia (UWB) in Pilsen. The firsttwo collections are broadcast news, the third corpus is a high-quality read-speech database. This paper describes the collection conditions, annotation and phonetic transcription process related to each corpus. The basic phonetic and lexical characteristics of all corpora will be given and compared mutually. Moreover the paper deals with problems encountered in large vocabulary continuous speech recognition of highly inflectional languages. The concept of morpheme-based language modeling is introducedand speech recognition results using word-based and morpheme-based language models are also reported.
Název v anglickém jazyce
Experiments with the recognition of highly inflected spoken language (czech) in the large vocabulary task
Popis výsledku anglicky
This paper presents three annotated and phonetically transcribed large speech corpora developed for spoken Czech. All corpora were collected during the last two years at the Department of Cybernetics, University of West Bohemia (UWB) in Pilsen. The firsttwo collections are broadcast news, the third corpus is a high-quality read-speech database. This paper describes the collection conditions, annotation and phonetic transcription process related to each corpus. The basic phonetic and lexical characteristics of all corpora will be given and compared mutually. Moreover the paper deals with problems encountered in large vocabulary continuous speech recognition of highly inflectional languages. The concept of morpheme-based language modeling is introducedand speech recognition results using word-based and morpheme-based language models are also reported.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LN00A063" target="_blank" >LN00A063: Centrum komputační lingvistiky</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2001
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Experiments with the recognition of highly inflected spoken language (czech) in the large vocabulary task
ISBN
9800775463
ISSN
—
e-ISSN
—
Počet stran výsledku
1
Strana od-do
—
Název nakladatele
Neuveden
Místo vydání
Orlando
Místo konání akce
Neuveden
Datum konání akce
1. 1. 2001
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—