The use of MLLR acoustic model adaptation of triphones for continuous speech recognition system based on HTK
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F12%3A00194682" target="_blank" >RIV/68407700:21230/12:00194682 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
slovinština
Název v původním jazyce
Použitie MLLR adaptácie akustických modelov trifónov v rozpoznávači spojitej reči na bázi HTK
Popis výsledku v původním jazyce
Adaptácia akustického modelu na rečníka, prostredie alebo kanál je všeobecne používaná metóda zvýšenia úspešnosti v systémoch automatického rozpoznávania reči. Jednou z často používaných je technika maximálne vierohodnej lineárnej regresie. Tento prístupobmedzuje počet voľných parametrov modelu združovaním komponent do tried a dokáže tak priniesť zvýšenie úspešnosti aj v situácii s malým množstvom adaptačných dát. V príspevku je analyzovaný prínos tejto techniky v reálnej aplikácii systému rozpoznávania spojitej reči na množine 11 rečníkov. Porovnané sú dva prístupy k tvorbe regresných tried, automatické delenie algoritmom a ručné delenie založené na fonetike. Uskutočné experimenty ukazujú, že oba prístupy sú si rovnocenné z hľadiska zlepšenia chybovosti.
Název v anglickém jazyce
The use of MLLR acoustic model adaptation of triphones for continuous speech recognition system based on HTK
Popis výsledku anglicky
The acoustic model adaptation, either on speaker channel or environment, is a generally used method to improve the performance of the speech recognition system. One of the more widely used is the maximum likelihood linear regression method. By grouping the model components into the classes, the number of parameters decreases, which results in performance improvement even with small amount of adaptation data. This article compares two different approaches to class construction : knowledge-based and automatic. The improvement is tested on the group of 11 speakers in a large vocabulary recognition system.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JA - Elektronika a optoelektronika, elektrotechnika
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
LETNÍ DOKTORANDSKÉ DNY 2012
ISBN
978-80-01-05050-7
ISSN
—
e-ISSN
—
Počet stran výsledku
7
Strana od-do
68-74
Název nakladatele
ČVUT
Místo vydání
Praha
Místo konání akce
Praha
Datum konání akce
24. 5. 2012
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—