Towards automatic transcription of spontaneous Czech speech in the MALACH project
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F03%3A00000155" target="_blank" >RIV/49777513:23520/03:00000155 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Towards automatic transcription of spontaneous Czech speech in the MALACH project
Popis výsledku v původním jazyce
Our paper discusses the progress achieved during one-year effort with building the Czech LVCSR system for an automatic transcription of spontaneously pronounced testimonies in the MALACH project. The difficulty of this task stems from the highly inf lectional nature of the Czech language and is further multiplied by the presence of many colloquial words in spontaneous Czech speech and also by the need to handle emotional speech filled with disfluencies, heavy accents, age-related coarticulation and language switching. In this paper we concetrate mainly on the acoustic issues - the proper choice of the front-end parameterization, handling the non-speech events in acoustic modeling and especially the unsupervised usage of the MLLR adaptation technique. Amethod for selecting suitable language model data is also briefly mentioned.
Název v anglickém jazyce
Towards automatic transcription of spontaneous Czech speech in the MALACH project
Popis výsledku anglicky
Our paper discusses the progress achieved during one-year effort with building the Czech LVCSR system for an automatic transcription of spontaneously pronounced testimonies in the MALACH project. The difficulty of this task stems from the highly inf lectional nature of the Czech language and is further multiplied by the presence of many colloquial words in spontaneous Czech speech and also by the need to handle emotional speech filled with disfluencies, heavy accents, age-related coarticulation and language switching. In this paper we concetrate mainly on the acoustic issues - the proper choice of the front-end parameterization, handling the non-speech events in acoustic modeling and especially the unsupervised usage of the MLLR adaptation technique. Amethod for selecting suitable language model data is also briefly mentioned.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LN00A063" target="_blank" >LN00A063: Centrum komputační lingvistiky</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Text, Speech and Dialogue
ISBN
3-540-20024-X
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
214-219
Název nakladatele
Springer
Místo vydání
Berlin
Místo konání akce
České Budějovice
Datum konání akce
8. 9. 2003
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—