Sequence-to-Sequence CNN-BiLSTM Based Glottal Closure Instant Detection from Raw Speech
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F22%3A43966100" target="_blank" >RIV/49777513:23520/22:43966100 - isvavai.cz</a>
Výsledek na webu
<a href="https://link.springer.com/chapter/10.1007/978-3-031-20650-4_9" target="_blank" >https://link.springer.com/chapter/10.1007/978-3-031-20650-4_9</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-031-20650-4_9" target="_blank" >10.1007/978-3-031-20650-4_9</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Sequence-to-Sequence CNN-BiLSTM Based Glottal Closure Instant Detection from Raw Speech
Popis výsledku v původním jazyce
In this paper, we propose to frame glottal closure instant (GCI) de- tection from raw speech as a sequence-to-sequence prediction problem and to explore the potential of recurrent neural networks (RNNs) to handle this prob- lem. We compare the RNN architecture to widely used convolutional neural net- works (CNNs) and to some other machine learning-based and traditional non- learning algorithms on several publicly available databases. We show that the RNN architecture improves GCI detection. The best results were achieved for a joint CNN-BiLSTM model in which RNN is composed of bidirectional long short-term memory (BiLSTM) units and CNN layers are used to extract relevant features.
Název v anglickém jazyce
Sequence-to-Sequence CNN-BiLSTM Based Glottal Closure Instant Detection from Raw Speech
Popis výsledku anglicky
In this paper, we propose to frame glottal closure instant (GCI) de- tection from raw speech as a sequence-to-sequence prediction problem and to explore the potential of recurrent neural networks (RNNs) to handle this prob- lem. We compare the RNN architecture to widely used convolutional neural net- works (CNNs) and to some other machine learning-based and traditional non- learning algorithms on several publicly available databases. We show that the RNN architecture improves GCI detection. The best results were achieved for a joint CNN-BiLSTM model in which RNN is composed of bidirectional long short-term memory (BiLSTM) units and CNN layers are used to extract relevant features.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Artificial Neural Networks in Pattern Recognition; 10th IAPR TC3 Workshop, ANNPR 2022; Dubai, United Arab Emirates, November 24-26, 2022; Proceedings
ISBN
978-3-031-20649-8
ISSN
0302-9743
e-ISSN
1611-3349
Počet stran výsledku
14
Strana od-do
107-120
Název nakladatele
Springer Nature Switzerland AG
Místo vydání
Cham
Místo konání akce
Dubai, United Arab Emirates
Datum konání akce
24. 11. 2022
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—