Modelování neřečových událostí při rozpoznávání čtených a spontánních promluv
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F08%3A03149357" target="_blank" >RIV/68407700:21230/08:03149357 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Speaker Non-Speech Event Modelling in Recognition of Read and Spontaneous Speech
Popis výsledku v původním jazyce
Modelling of non-speech events brings the necessary robustness in the recognition of natural or spontaneous utterances which are usually full of such acoustic disfluencies. This paper presents the solution of speaker non-speech event modelling commonly with the analyzes how efficiently these events are modelled. Firstly, the procedure for efficient training of non-speech event models on read speech data is presented. The results of experiments with simple ASR achieved 26,% decrease of word error rateand a~significant decrease of insertion rate with these models. Secondly, the extension of training data with spontaneous speech collection is described. It contributes to the availability of more natural data for training purposes and mainly to the better training of non-speech event models, which is demonstrated by the experiment on filled pause recognition.
Název v anglickém jazyce
Speaker Non-Speech Event Modelling in Recognition of Read and Spontaneous Speech
Popis výsledku anglicky
Modelling of non-speech events brings the necessary robustness in the recognition of natural or spontaneous utterances which are usually full of such acoustic disfluencies. This paper presents the solution of speaker non-speech event modelling commonly with the analyzes how efficiently these events are modelled. Firstly, the procedure for efficient training of non-speech event models on read speech data is presented. The results of experiments with simple ASR achieved 26,% decrease of word error rateand a~significant decrease of insertion rate with these models. Secondly, the extension of training data with spontaneous speech collection is described. It contributes to the availability of more natural data for training purposes and mainly to the better training of non-speech event models, which is demonstrated by the experiment on filled pause recognition.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JA - Elektronika a optoelektronika, elektrotechnika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Digital Technologies 2008
ISBN
978-80-8070-953-2
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
—
Název nakladatele
Žilinská universita, Elektrotechnická fakulta
Místo vydání
Žilina
Místo konání akce
Žilina
Datum konání akce
20. 11. 2008
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—