Investigation into the use of deep neural networks for LVCSR of Czech
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F46747885%3A24220%2F15%3A%230003430" target="_blank" >RIV/46747885:24220/15:#0003430 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/46747885:24220/15:00002969
Výsledek na webu
<a href="http://dx.doi.org/10.1109/ECMSM.2015.7208708" target="_blank" >http://dx.doi.org/10.1109/ECMSM.2015.7208708</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/ECMSM.2015.7208708" target="_blank" >10.1109/ECMSM.2015.7208708</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Investigation into the use of deep neural networks for LVCSR of Czech
Popis výsledku v původním jazyce
This paper deals with utilization of deep neural networks (DNNs) for speech recognition. The main goal is to find out the best strategy for training and utilization of these models within an acoustic modeling module of a large vocabulary continuous speech recognition (LVCSR) system of Czech language. For this purpose, various DNNs are trained a) using several training strategies, b) with different inner structure and c) using various kinds of features. Experimental evaluation is then performed on a large dataset including broadcast recordings, recordings of lectures, dictates of judgments and set of nonlinearly distorted utterances. The resulting recipe for training of DNNs for our LVCSR system employs a) ReLU activation function with hidden layer width of 1024 neurons and b) filter-bank based features.
Název v anglickém jazyce
Investigation into the use of deep neural networks for LVCSR of Czech
Popis výsledku anglicky
This paper deals with utilization of deep neural networks (DNNs) for speech recognition. The main goal is to find out the best strategy for training and utilization of these models within an acoustic modeling module of a large vocabulary continuous speech recognition (LVCSR) system of Czech language. For this purpose, various DNNs are trained a) using several training strategies, b) with different inner structure and c) using various kinds of features. Experimental evaluation is then performed on a large dataset including broadcast recordings, recordings of lectures, dictates of judgments and set of nonlinearly distorted utterances. The resulting recipe for training of DNNs for our LVCSR system employs a) ReLU activation function with hidden layer width of 1024 neurons and b) filter-bank based features.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/TA04010199" target="_blank" >TA04010199: MULTILINMEDIA - Multilinguální platforma pro monitoring a analýzu multimédií</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
2015 IEEE International Workshop of Electronics, Control, Measurement, Signals and their application to Mechatronics
ISBN
978-1-4799-6972-2
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
38-41
Název nakladatele
IEEE
Místo vydání
Česká Republika
Místo konání akce
Česká Republika, Liberec
Datum konání akce
1. 1. 2015
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000363814500033