MLLR Transforms Based Speaker Recognition in Broadcast Streams
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F46747885%3A24220%2F09%3A%230001399" target="_blank" >RIV/46747885:24220/09:#0001399 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
MLLR Transforms Based Speaker Recognition in Broadcast Streams
Popis výsledku v původním jazyce
This paper deals with utilization of maximum likelihood linear regression (MLLR) adaptation transforms for speaker recognition in broadcast news streams. This task is specific particularly for widely varying acoustic conditions, microphones, transmissionchannels, background noise and short duration of recordings (usually in the range from 5 to 15 seconds). MLLR transforms based features are modeled using support vector machines (SVM). Obtained results are compared with a GMM based system with traditional MFCC features. The paper also deals with inter-session variability compensation techniques suitable for both systems and emphases the importance of feature vector scaling for SVM based system.
Název v anglickém jazyce
MLLR Transforms Based Speaker Recognition in Broadcast Streams
Popis výsledku anglicky
This paper deals with utilization of maximum likelihood linear regression (MLLR) adaptation transforms for speaker recognition in broadcast news streams. This task is specific particularly for widely varying acoustic conditions, microphones, transmissionchannels, background noise and short duration of recordings (usually in the range from 5 to 15 seconds). MLLR transforms based features are modeled using support vector machines (SVM). Obtained results are compared with a GMM based system with traditional MFCC features. The paper also deals with inter-session variability compensation techniques suitable for both systems and emphases the importance of feature vector scaling for SVM based system.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/VD20072010B16" target="_blank" >VD20072010B16: Překlenutí jazykové bariéry, komplikující vyšetřování financování terorismu a závažné finanční kriminality</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2009
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Lecture Notes in Artificial Inteligence, LNAI 5641
ISBN
978-3-642-03319-3
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
9
Strana od-do
—
Název nakladatele
SPRINGER-VERLAG BERLIN
Místo vydání
BERLIN, GERMANY
Místo konání akce
Prague, CZECH REPUBLIC
Datum konání akce
1. 1. 2008
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—