Redukce a dekorelace příznakového prostoru testovaná ve velkém množství experimentů s rozpoznáváním řeči
Popis výsledku
Článek studuje vliv redukce dimenze a dekorelace příznakového prostoru na výkon (přesnost) systému automatického rozpoznávání řeči. Základní systém rozpoznávání řeči založený na PLP-parametrizaci a pracující se zerogramovým jazykovým modelem byl natrénován hlasy jednoho tisíce řečníků. Při experimentech byly testovány techniky založené na LDA, HLDA a SHLDA (vyhlazená HLDA) a byla hledána optimální dimenze příznakového prostoru.
Klíčová slova
automatic speech recognitionfeature space reductionPLP-based parameterization
Identifikátory výsledku
Kód výsledku v IS VaVaI
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Feature space reduction and decorrelation in a large number of speech recognition experiments
Popis výsledku v původním jazyce
The paper studies the influence of significant space reduction and decorrelation techniques on the performance of an automatic speech recognition (ASR) system. A baseline PLP-based ASR system, which works with zero-gram language model was trained using speech of one thousand speakers. The Linear Discriminant Analysis (LDA), Heteroscedastic LDA (HLDA) and Smoothed HLDA (SHLDA) techniques were applied and compared in many experiments in which an optimum dimension of feature space was searched for.
Název v anglickém jazyce
Feature space reduction and decorrelation in a large number of speech recognition experiments
Popis výsledku anglicky
The paper studies the influence of significant space reduction and decorrelation techniques on the performance of an automatic speech recognition (ASR) system. A baseline PLP-based ASR system, which works with zero-gram language model was trained using speech of one thousand speakers. The Linear Discriminant Analysis (LDA), Heteroscedastic LDA (HLDA) and Smoothed HLDA (SHLDA) techniques were applied and compared in many experiments in which an optimum dimension of feature space was searched for.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
1QS101470516: Automatické vyhledávání klíčových slov v proudu zvukových dat
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
9th IASTED International Conference on Signal and Image Processing
ISBN
978-0-88986-675-1
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
—
Název nakladatele
Acta Press
Místo vydání
Anaheim
Místo konání akce
Honolulu
Datum konání akce
22. 8. 2007
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000251419000028
Základní informace
Druh výsledku
D - Stať ve sborníku
CEP
JD - Využití počítačů, robotika a její aplikace
Rok uplatnění
2007