Audio Enhancing With DNN Autoencoder For Speaker Recognition
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F16%3APU121617" target="_blank" >RIV/00216305:26230/16:PU121617 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.fit.vutbr.cz/research/pubs/all.php?id=11139" target="_blank" >http://www.fit.vutbr.cz/research/pubs/all.php?id=11139</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/ICASSP.2016.7472647" target="_blank" >10.1109/ICASSP.2016.7472647</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Audio Enhancing With DNN Autoencoder For Speaker Recognition
Popis výsledku v původním jazyce
We have presented our approach towards building a robust speaker recognition system. We concentrated on improving the performance on noisy and reverberant data by means of a DNN autoencoder, which is trained to remove both additive noise and reverberation from audio. We showed that our method significantly improves the performance of both state-of-the-art text-dependent and textindependent speaker recognition systems in the domain of distant microphone recordings. We analyzed and discussed the effect of the proposed method both on real-world data as well as on artificially created data. The artificially created data allowed us to measure the effect of enhancing separately for distortions caused by additive noise or reverberation.
Název v anglickém jazyce
Audio Enhancing With DNN Autoencoder For Speaker Recognition
Popis výsledku anglicky
We have presented our approach towards building a robust speaker recognition system. We concentrated on improving the performance on noisy and reverberant data by means of a DNN autoencoder, which is trained to remove both additive noise and reverberation from audio. We showed that our method significantly improves the performance of both state-of-the-art text-dependent and textindependent speaker recognition systems in the domain of distant microphone recordings. We analyzed and discussed the effect of the proposed method both on real-world data as well as on artificially created data. The artificially created data allowed us to measure the effect of enhancing separately for distortions caused by additive noise or reverberation.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/VI20152020025" target="_blank" >VI20152020025: Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony - DRAPÁK</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 41th IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2016), 2016
ISBN
978-1-4799-9988-0
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
5090-5094
Název nakladatele
IEEE Signal Processing Society
Místo vydání
Shanghai
Místo konání akce
Shanghai
Datum konání akce
20. 3. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000388373405048