Prozodická analýza a modelování
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F12%3A00194711" target="_blank" >RIV/68407700:21230/12:00194711 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Prozodická analýza a modelování
Popis výsledku v původním jazyce
Při přepisu mluvené řeči na textové řetězce slov klasickými systémy pro rozpoznávání řeči (ASR) obvykle ztrácíme jistou část informace v podobě chybějících interpunkčních značek. To jednak snižuje čitelnost výsledného textu a v druhé řadě může být otázkalehce zaměněna za větu oznamovací (při zcela shodném slovosledu, který čeština v tomto případě připouští). Navíc v určitých situacích, kdy je například možné rozdělit danou promluvu na slova více způsoby (typickým příkladem je fráze "světlovnímají"), klasické rozpoznávače klíčovou prozodickou informaci pro rozhodování nevyužívají. Příspěvek se zabývá problematikou obou zmíněných případů. V popisovaném výzkumu se zaměřujeme hlavně na češtinu, avšak užité principy jsou zobecnitelné i na ostatní jazyky. Vprvním představeném experimentu jsme se snažili detekovat modality vět pouze z intonačního průběhu promluvy. Klasifikace byla realizovaná vícevrstvou dopřednou neuronovou sítí a byla snaha o nezávislosti na systému pro rozpoznávání řeči.
Název v anglickém jazyce
Prosodic analysis and modeling
Popis výsledku anglicky
When transcribing spoken speech into text strings with classical automatic speech recognition (ASR) system, we usually lose some part of information (puncutation marks, ...). This decreases readability of the transcribed text and brings difficulties to distinguish questions and statements (in Czech they have same word order). Also, in some particular cases there are more possibilities to split given utterance into words (typical example is Czech phrase "světlovnímají"). In this case the classical ASR systems do not utilize prosodic information for this word splitting decision. The article deals with both these mentioned phenomenes. In described research we deal with Czech, but the used approaches are general and should be usable in other languages too.In first presented experiment we tried to detect modiliaty of the senteces from intionation contour. Classification was realized by multilayer feedforward perceptron artificial neural network (ANN) and our aim was speaker independence of
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
JA - Elektronika a optoelektronika, elektrotechnika
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů