Analýza výpočtu příznaků a kompenzace na kanál v GMM systému pro rozpoznávání mluvčího
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F07%3APU70764" target="_blank" >RIV/00216305:26230/07:PU70764 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Analysis of feature extraction and channel compensation in GMM speaker recognition system
Popis výsledku v původním jazyce
In this paper, several feature extraction and channel compensation techniques found in state-of-the-art speaker verification systems are analyzed and discussed. For NIST SRE 2006 submission, Cepstral Mean Subtraction, Feature Warping, RASTA filtering, HLDA, Feature Mapping and eigenchannel adaptation were incrementally added to minimize system's error rate. The key-part of the paper is however the post-evaluation analysis, undermining the common myth "the more boxes in the scheme, the better system". All results are presented on NIST SRE 2005 and 2006 data.
Název v anglickém jazyce
Analysis of feature extraction and channel compensation in GMM speaker recognition system
Popis výsledku anglicky
In this paper, several feature extraction and channel compensation techniques found in state-of-the-art speaker verification systems are analyzed and discussed. For NIST SRE 2006 submission, Cepstral Mean Subtraction, Feature Warping, RASTA filtering, HLDA, Feature Mapping and eigenchannel adaptation were incrementally added to minimize system's error rate. The key-part of the paper is however the post-evaluation analysis, undermining the common myth "the more boxes in the scheme, the better system". All results are presented on NIST SRE 2005 and 2006 data.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
IEEE Transactions on Audio, Speech, and Language Processing
ISSN
1558-7916
e-ISSN
—
Svazek periodika
15
Číslo periodika v rámci svazku
7
Stát vydavatele periodika
US - Spojené státy americké
Počet stran výsledku
8
Strana od-do
1979-1986
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—