Modelování kontur akustických a prózodických parametrů v rozpoznávání řečníka

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F08%3APU78095" target="_blank" >RIV/00216305:26230/08:PU78095 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
angličtina
Název v původním jazyce
Contour modeling of prosodic and acoustic features for speaker recognition
Popis výsledku v původním jazyce
In this paper we use acoustic and prosodic features jointly in a long temporal lexical context for automatic speaker recognition from speech. The contours of pitch, energy and cepstral coefficients are continuously modeled over the time span of a syllable to capture the speaking style on phonetic level. As these features are affected by session variability, established channel compensation techniques are examined. Results for the combination of different features on a syllable-level as well as for channel compensation are presented for the NIST SRE 2006 speaker identification task. To show the complementary<br>character of the features, the proposed system is fused with<br>an acoustic short-time system, leading to a relative improvement of 10:4%.
Název v anglickém jazyce
Contour modeling of prosodic and acoustic features for speaker recognition
Popis výsledku anglicky
In this paper we use acoustic and prosodic features jointly in a long temporal lexical context for automatic speaker recognition from speech. The contours of pitch, energy and cepstral coefficients are continuously modeled over the time span of a syllable to capture the speaking style on phonetic level. As these features are affected by session variability, established channel compensation techniques are examined. Results for the combination of different features on a syllable-level as well as for channel compensation are presented for the NIST SRE 2006 speaker identification task. To show the complementary<br>character of the features, the proposed system is fused with<br>an acoustic short-time system, leading to a relative improvement of 10:4%.

Klasifikace

Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—

Návaznosti výsledku

Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)

Ostatní

Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Název statě ve sborníku
Proc. 2008 IEEE Workshop on Spoken Language Technology
ISBN
978-1-4244-3472-5
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
—
Název nakladatele
IEEE Signal Processing Society
Místo vydání
Goa
Místo konání akce
Goa
Datum konání akce
15. 12. 2008
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—

Podobné výsledky(10)

Doménová a jazyková přenositelnost akustických příznaků odhadovaných vícevrstvým perceptronem Modelování dynamiky prosodie pro rozpoznání řečníka Speaker-clustered Acoustic Models Evaluated on GPU for on-line Subtitling of Parliament Meetings

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Modelování kontur akustických a prózodických parametrů v rozpoznávání řečníka

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)