iVector-Based Discriminative Adaptation for Automatic Speech Recognition
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F11%3APU96155" target="_blank" >RIV/00216305:26230/11:PU96155 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
iVector-Based Discriminative Adaptation for Automatic Speech Recognition
Popis výsledku v původním jazyce
The iVector is a low-dimensional fixed-length representation of information about speaker and acoustic environment. To utilize iVectors for adaptation, region dependent linear transforms (RDLT) are discriminatively trained using the MPE criterion on large amounts of annotated data to extract the relevant information from iVectors and to compensate speech features. The approach was tested on standard CTS data. We found it to be complementary to common adaptation techniques. On a well-tuned RDLT system with standard CMLLR adaptation we reached an 0.8% additive absolute WER improvement.
Název v anglickém jazyce
iVector-Based Discriminative Adaptation for Automatic Speech Recognition
Popis výsledku anglicky
The iVector is a low-dimensional fixed-length representation of information about speaker and acoustic environment. To utilize iVectors for adaptation, region dependent linear transforms (RDLT) are discriminatively trained using the MPE criterion on large amounts of annotated data to extract the relevant information from iVectors and to compensate speech features. The approach was tested on standard CTS data. We found it to be complementary to common adaptation techniques. On a well-tuned RDLT system with standard CMLLR adaptation we reached an 0.8% additive absolute WER improvement.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2011
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of ASRU 2011
ISBN
978-1-4673-0366-8
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
152-157
Název nakladatele
IEEE Signal Processing Society
Místo vydání
Hilton Waikoloa Village, Big Island, Hawaii
Místo konání akce
Hilton Waikoloa Village Resort, Big Island, Hawa
Datum konání akce
11. 12. 2011
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—