Some like it Gaussian ...
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26220%2F02%3APU29734" target="_blank" >RIV/00216305:26220/02:PU29734 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/00216305:26220/02:PU36267 RIV/00216305:26230/02:PU36267
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Some like it Gaussian ...
Popis výsledku v původním jazyce
In Hidden Markov models, speech features are modeled by Gaussian distributions. In this paper, we propose to gaussianize the features to better fit to this modeling. A distribution of the data is estimated and a transform function is derived. We have tested two methods of the transform estimation (global and speaker based). The results are reported on recognition of isolated Czech words (SpeechDat-E) with CI and CD models and on medium vocabulary continuous speech recognition task (SPINE). Gaussianizedddata provided in all three cases results superior to standard MFC coefficients proving, that the gaussianization is a cheap way to increase the recognition accuracy.
Název v anglickém jazyce
Some like it Gaussian ...
Popis výsledku anglicky
In Hidden Markov models, speech features are modeled by Gaussian distributions. In this paper, we propose to gaussianize the features to better fit to this modeling. A distribution of the data is estimated and a transform function is derived. We have tested two methods of the transform estimation (global and speaker based). The results are reported on recognition of isolated Czech words (SpeechDat-E) with CI and CD models and on medium vocabulary continuous speech recognition task (SPINE). Gaussianizedddata provided in all three cases results superior to standard MFC coefficients proving, that the gaussianization is a cheap way to increase the recognition accuracy.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JA - Elektronika a optoelektronika, elektrotechnika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA102%2F02%2F0124" target="_blank" >GA102/02/0124: Hlasové technologie v podpoře informační společnosti</a><br>
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2002
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the conference TSD'2002
ISBN
3-540-44129-8
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
321-324
Název nakladatele
Neuveden
Místo vydání
Brno 2002
Místo konání akce
Brno
Datum konání akce
9. 9. 2002
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—