Detekce řečové aktivity na bázi HMM a GMM modelování
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F10%3A00174159" target="_blank" >RIV/68407700:21230/10:00174159 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Detekce řečové aktivity na bázi HMM a GMM modelování
Popis výsledku v původním jazyce
Článek popisuje několik algoritmů detekce řečové aktivity, která představuje významnou úlohu řešenou v oblasti zpracování řeči a která je stále intenzivně rozvíjena v současném výzkumu v celosvětovém měřítku. V tomto článku jsou popisované algoritmy na bázi gaussovských směsí (GMM) a skrytých Markovových modelů (HMM) včetně analýzy použití vhodných parametrů. Studované detektory byly srovnány s referenčními energetickými a kepstrálními detektory a také s lagoritmem na bázi normy ITU-T G.729. Experimentybyly provedeny se signály z databáze CZKCC obsahující promluvy z jedoucího automobilu, kde se prokázal významný přínos použití GMM a HMM detektorů, zejména pro silněji zarušené signály.
Název v anglickém jazyce
HMM and GMM Based Voice Activity Detectors
Popis výsledku anglicky
This article describes several solutions of voice activity detection which represents an important subpart of more general research in the field of speech processing and which is a subject of many contemporary research activities and many applications ofspeech technology. The approaches based on Gaussian mixture models and hidden Markov models are presented in this article, commonly with the study of using different speech parametrizations in GMM and HMM based VADs. Presented detectors were compared with referential heuristic algorithms based on energy and cepstral analysis, and with the VAD accoding to ITU-T G.729 recommendation. The testing of suggested algorithms was realized using the data from CZKCC signal database recorded in running car and thecontribution of proposed statistical detectors based on GMM and HMM is evident, especially, for speech signals collected in very noisy environment.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
JA - Elektronika a optoelektronika, elektrotechnika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2010
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Akustické listy
ISSN
1212-4702
e-ISSN
—
Svazek periodika
16
Číslo periodika v rámci svazku
2-3
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
9
Strana od-do
—
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—