Neural-Network-based Spectrum Processing for Speech Recognition and Speaker Verification
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F15%3A43926637" target="_blank" >RIV/49777513:23520/15:43926637 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-319-25789-1_27" target="_blank" >http://dx.doi.org/10.1007/978-3-319-25789-1_27</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-25789-1_27" target="_blank" >10.1007/978-3-319-25789-1_27</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Neural-Network-based Spectrum Processing for Speech Recognition and Speaker Verification
Popis výsledku v původním jazyce
In this paper, neural networks are applied as a feature extractors for a speech recognition system and a speaker verification system. A long-temporal features with delta coefficients, mean and variance normalization are applied when a neural-network-based feature extraction is trained together with a neural-network-based voice activity detector and with a neural-network-based acoustic model for speech recognition. In speaker verification, the acoustic model is replaced with a score computation. The performance of our speech recognition system was evaluated on the British English speech corpus WSJCAM0 and the performance of our speech verification system was evaluated on our Czech speech corpus.
Název v anglickém jazyce
Neural-Network-based Spectrum Processing for Speech Recognition and Speaker Verification
Popis výsledku anglicky
In this paper, neural networks are applied as a feature extractors for a speech recognition system and a speaker verification system. A long-temporal features with delta coefficients, mean and variance normalization are applied when a neural-network-based feature extraction is trained together with a neural-network-based voice activity detector and with a neural-network-based acoustic model for speech recognition. In speaker verification, the acoustic model is replaced with a score computation. The performance of our speech recognition system was evaluated on the British English speech corpus WSJCAM0 and the performance of our speech verification system was evaluated on our Czech speech corpus.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/DF12P01OVV022" target="_blank" >DF12P01OVV022: Zpřístupnění rozsáhlého video archivu kulturního dědictví pomocí metod automatického rozpoznávání mluvené řeči a strojového překladu. (AMALACH)</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Statistical Language and Speech Processing, Third International Conference, SLSP 2015, Budapest, Hungary, November 24-26, 2015. Proceedings
ISBN
978-3-319-25788-4
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
12
Strana od-do
288-299
Název nakladatele
Springer
Místo vydání
Heidelberg
Místo konání akce
Budapešť, Maďarsko
Datum konání akce
24. 11. 2015
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—