Voice Activity Detection based-on Statistic Models
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26220%2F05%3APU51360" target="_blank" >RIV/00216305:26220/05:PU51360 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Voice Activity Detection based-on Statistic Models
Original language description
This paper deals with the method of voice activity detection. Rising requirements to applications with variable-rate speech coding also increases the role of voice activity detectors which become crucial for the efficient bandwidth reduction. The paper aims especially to two detector types; these are the detector based on short-time signal energy and statistical model-based voice activity detector. Decision-making rules of the statistical model-based detector are derived from the LRT (Likelihood Ratio TTest) by estimating unknown parameters using the ML (Maximum Likelihood) criterion. In addition there is an effective hang-over scheme based on HMM (Hidden Markov Model) principles in the detector. There were models for these detectors created in Matlabsimulation environment. Models were tested on voice signals with the white noise as well as real noises. The results were evaluated and compared for various types of noises and SNR (Signal to Noise Ratios) values.
Czech name
Detektor řečové aktivity založený na statistických metodách
Czech description
Příspěvek se věnuje metodám detekce řečového signálu. Se vzrůstajícím počtem aplikací širokopásmového kódování řeči se zvyšuje úloha detektorů řečové aktivity s ohledem na dosažení co nejužšího pásma. Příspěvek se zaměřuje na dva typy detektorů; je to detektor založený na sledování krátkodobé energie signálu a detektor založený na statistických metodách. Rozhodovací pravidlo statistického detektoru je odvozeno od testu maximální podobnosti LRT (Likelihood Ratio Test), kdy neznámé parametry jsou odhadnutty metodou maximální podobnosti ML (Maximum Likelihood). Navíc je doplněn efektivním modelem přechodu mezi řečovými a šumovými segmenty založeným na skrytých Markovových řetězcích. Oba detektory byly simulovány v prostředí Matlab a byly testovány na různých nahrávkách obsahujících umělé i reálné hluky pro různé poměry signálu od šumu.
Classification
Type
D - Article in proceedings
CEP classification
JA - Electronics and optoelectronics
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2005
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Proceedings of the 16th Conference Electronic Speech Signal Processing
ISBN
3-938863-17-X
ISSN
—
e-ISSN
—
Number of pages
6
Pages from-to
175-180
Publisher name
Academy of Science of the Czech Republic, Institute of Radio Engineering and Electronics
Place of publication
Prague, Czech Republic
Event location
Prague, Lichenstein Palace
Event date
Sep 26, 2005
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—