Noise cancellation algorithms for speech signal distorted in telecommunication networks.
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26220%2F06%3APU64281" target="_blank" >RIV/00216305:26220/06:PU64281 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Noise cancellation algorithms for speech signal distorted in telecommunication networks.
Original language description
This paper aims to provide an evaluation of the effectiveness of three different speech noise power spectrum estimation algorithms The evaluation of their efficiency was based on the hit rate recognition obtained at the output of an HMM phoneme based speech recognizer. Noisy speech consisted of 100 speech sentences randomly extracted from the NTIMIT database. The best speech noise power spectrum estimator proved to be a procedure based on the arithmetic average of the power spectrums obtained from signal frames where no speech activity was detected. The noise spectrum estimate provide by either a four layer MLP neural network, or an Adaptive Neural Fuzzy Inference System (ANFIS) proved to give lower performance than the average noise spectrum estimator, even though both of them are able to detect some of the noise features and the ANFIS performance are better than those obtained from the MLP neural network.
Czech name
Algoritmy pro odstraňování šumu v řeči zkreslené telekomunikační sítí
Czech description
Tento článek ukazuje možnost využití systémů umělé inteligence v algoritmech pro zvýraznění řeči v hlučném pozadí. Článek porovnává efektivitu tří odlišných systémů pro potlačení šumu založených na metodě spektrální subtrakce. První systém odhaduje spektrum šumu na základě jeho statistických vlastností. Další dva systémy odhadují spektrum šumu pomocí nelineárních adaptivních modelů. Efektivita popsaných algoritmů je vyhodnocena na základě úspěšnosti rozpoznání zpracovaných řečových nahrávek počítačovýmrozpoznávačem řeči založeným na skrytých Markovových modelech. Algoritmy jsou testovány na databázi NTIMIT obsahující krátké nahrávky řečových promluv přenesené skutečnou telekomunikační sítí americké firmy NYTEX.
Classification
Type
D - Article in proceedings
CEP classification
JA - Electronics and optoelectronics
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/GA102%2F06%2F1233" target="_blank" >GA102/06/1233: The Optimalization of Algorithms for Digital Audio Processing</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2006
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
16th Czech-German Workshop on speech processing
ISBN
86269-15-9
ISSN
—
e-ISSN
—
Number of pages
7
Pages from-to
1-7
Publisher name
Ústav radiotechniky a elektroniky, Akademie věd České republiky.
Place of publication
česká republika, Praha
Event location
Praha
Event date
Sep 27, 2006
Type of event by nationality
EUR - Evropská akce
UT code for WoS article
—