Initialization of Adaptation by Sufficient Statistics Using Phonetic Tree
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F12%3A43915992" target="_blank" >RIV/49777513:23520/12:43915992 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Initialization of Adaptation by Sufficient Statistics Using Phonetic Tree
Popis výsledku v původním jazyce
In this work we deal with the problem of small amount of data when estimating a feature transformation for the speaker adaptation of an acoustic model. Our goal is to compensate for the lack of adaptation data by a proper initialization of transformationmatrices. Methods used in such situations are described, they are based on collecting additional accumulated statistics from nearest speakers. The proposed initialization approach is based on accumulated statistics too, but it incorporates also phoneticinformation when selecting the ?nearest? statistics. Initialization methods compensating for the absence of actual speaker?s data are tested on telephone recordings with different amounts of adaptation data. In worst situation with extremely small amount of adaptation data relative improvement of 5% is obtained.
Název v anglickém jazyce
Initialization of Adaptation by Sufficient Statistics Using Phonetic Tree
Popis výsledku anglicky
In this work we deal with the problem of small amount of data when estimating a feature transformation for the speaker adaptation of an acoustic model. Our goal is to compensate for the lack of adaptation data by a proper initialization of transformationmatrices. Methods used in such situations are described, they are based on collecting additional accumulated statistics from nearest speakers. The proposed initialization approach is based on accumulated statistics too, but it incorporates also phoneticinformation when selecting the ?nearest? statistics. Initialization methods compensating for the absence of actual speaker?s data are tested on telephone recordings with different amounts of adaptation data. In worst situation with extremely small amount of adaptation data relative improvement of 5% is obtained.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/DF12P01OVV022" target="_blank" >DF12P01OVV022: Zpřístupnění rozsáhlého video archivu kulturního dědictví pomocí metod automatického rozpoznávání mluvené řeči a strojového překladu. (AMALACH)</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings 2012 IEEE 11th International Conference on Signal Processing
ISBN
978-1-4673-2194-5
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
503-506
Název nakladatele
IEEE Press
Místo vydání
Beijing
Místo konání akce
Beijing
Datum konání akce
21. 10. 2012
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—