Prosodic analysis and modeling
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F12%3A00194711" target="_blank" >RIV/68407700:21230/12:00194711 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Prozodická analýza a modelování
Original language description
Při přepisu mluvené řeči na textové řetězce slov klasickými systémy pro rozpoznávání řeči (ASR) obvykle ztrácíme jistou část informace v podobě chybějících interpunkčních značek. To jednak snižuje čitelnost výsledného textu a v druhé řadě může být otázkalehce zaměněna za větu oznamovací (při zcela shodném slovosledu, který čeština v tomto případě připouští). Navíc v určitých situacích, kdy je například možné rozdělit danou promluvu na slova více způsoby (typickým příkladem je fráze "světlovnímají"), klasické rozpoznávače klíčovou prozodickou informaci pro rozhodování nevyužívají. Příspěvek se zabývá problematikou obou zmíněných případů. V popisovaném výzkumu se zaměřujeme hlavně na češtinu, avšak užité principy jsou zobecnitelné i na ostatní jazyky. Vprvním představeném experimentu jsme se snažili detekovat modality vět pouze z intonačního průběhu promluvy. Klasifikace byla realizovaná vícevrstvou dopřednou neuronovou sítí a byla snaha o nezávislosti na systému pro rozpoznávání řeči.
Czech name
Prozodická analýza a modelování
Czech description
Při přepisu mluvené řeči na textové řetězce slov klasickými systémy pro rozpoznávání řeči (ASR) obvykle ztrácíme jistou část informace v podobě chybějících interpunkčních značek. To jednak snižuje čitelnost výsledného textu a v druhé řadě může být otázkalehce zaměněna za větu oznamovací (při zcela shodném slovosledu, který čeština v tomto případě připouští). Navíc v určitých situacích, kdy je například možné rozdělit danou promluvu na slova více způsoby (typickým příkladem je fráze "světlovnímají"), klasické rozpoznávače klíčovou prozodickou informaci pro rozhodování nevyužívají. Příspěvek se zabývá problematikou obou zmíněných případů. V popisovaném výzkumu se zaměřujeme hlavně na češtinu, avšak užité principy jsou zobecnitelné i na ostatní jazyky. Vprvním představeném experimentu jsme se snažili detekovat modality vět pouze z intonačního průběhu promluvy. Klasifikace byla realizovaná vícevrstvou dopřednou neuronovou sítí a byla snaha o nezávislosti na systému pro rozpoznávání řeči.
Classification
Type
O - Miscellaneous
CEP classification
JA - Electronics and optoelectronics
OECD FORD branch
—
Result continuities
Project
—
Continuities
S - Specificky vyzkum na vysokych skolach
Others
Publication year
2012
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů