On Comparison of XGBoost and Convolutional Neural Networks for Glottal Closure Instant Detection
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F21%3A43962410" target="_blank" >RIV/49777513:23520/21:43962410 - isvavai.cz</a>
Výsledek na webu
<a href="https://link.springer.com/chapter/10.1007%2F978-3-030-83527-9_38" target="_blank" >https://link.springer.com/chapter/10.1007%2F978-3-030-83527-9_38</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-030-83527-9_38" target="_blank" >10.1007/978-3-030-83527-9_38</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
On Comparison of XGBoost and Convolutional Neural Networks for Glottal Closure Instant Detection
Popis výsledku v původním jazyce
In this paper, we progress further in the development of an automatic GCI detection model. In previous papers, we compared XGBoost with other supervised learning models just as with a deep one-dimensional convolutional neural network. Here we aimed to compare a deep one-dimensional convolutional neural network, more precisely the InceptionV3 model, with XGBoost and context-aware XGBoost models trained on the same size datasets. Afterward, we wanted to reveal the influence of dataset consistency and size on the XGBoost performance. All newly created models are compared while tested on our custom test dataset. On the publicly available databases, the XGBoost and context-aware XGBoost with the context of length 7 shows similar and better performance than the InceptionV3 model. Also, the consistency of the training dataset shows significant performance improvement in comparison to the older models.
Název v anglickém jazyce
On Comparison of XGBoost and Convolutional Neural Networks for Glottal Closure Instant Detection
Popis výsledku anglicky
In this paper, we progress further in the development of an automatic GCI detection model. In previous papers, we compared XGBoost with other supervised learning models just as with a deep one-dimensional convolutional neural network. Here we aimed to compare a deep one-dimensional convolutional neural network, more precisely the InceptionV3 model, with XGBoost and context-aware XGBoost models trained on the same size datasets. Afterward, we wanted to reveal the influence of dataset consistency and size on the XGBoost performance. All newly created models are compared while tested on our custom test dataset. On the publicly available databases, the XGBoost and context-aware XGBoost with the context of length 7 shows similar and better performance than the InceptionV3 model. Also, the consistency of the training dataset shows significant performance improvement in comparison to the older models.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/GA19-19324S" target="_blank" >GA19-19324S: Plně trénovatelná syntéza české řeči z textu s využitím hlubokých neuronových sítí</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Text, Speech, and Dialogue 24th International Conference, TSD 2021, Olomouc, Czech Republic, September 6–9, 2021, Proceedings
ISBN
978-3-030-83526-2
ISSN
0302-9743
e-ISSN
1611-3349
Počet stran výsledku
9
Strana od-do
448-456
Název nakladatele
Springer International Publishing
Místo vydání
Cham
Místo konání akce
Olomouc, Czech Republic
Datum konání akce
6. 9. 2021
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—