Classification-Based Detection of Glottal Closure Instants from Speech Signals
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F17%3A43932654" target="_blank" >RIV/49777513:23520/17:43932654 - isvavai.cz</a>
Výsledek na webu
<a href="https://pdfs.semanticscholar.org/7733/cc382ff4110debd11a188674f317a0e5dc89.pdf" target="_blank" >https://pdfs.semanticscholar.org/7733/cc382ff4110debd11a188674f317a0e5dc89.pdf</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.21437/Interspeech.2017-213" target="_blank" >10.21437/Interspeech.2017-213</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Classification-Based Detection of Glottal Closure Instants from Speech Signals
Popis výsledku v původním jazyce
In this paper a classification-based method for the automatic detection of glottal closure instants (GCIs) from the speech sig- nal is proposed. Peaks in the speech waveforms are taken as candidates for GCI placements. A classification framework is used to train a classification model and to classify whether or not a peak corresponds to the GCI. We show that the detection accuracy in terms of F 1 score is 97.27%. In addition, despite using the speech signal only, the proposed method behaves com- parably to a method utilizing the glottal signal. The method is also compared with three existing GCI detection algorithms on publicly available databases.
Název v anglickém jazyce
Classification-Based Detection of Glottal Closure Instants from Speech Signals
Popis výsledku anglicky
In this paper a classification-based method for the automatic detection of glottal closure instants (GCIs) from the speech sig- nal is proposed. Peaks in the speech waveforms are taken as candidates for GCI placements. A classification framework is used to train a classification model and to classify whether or not a peak corresponds to the GCI. We show that the detection accuracy in terms of F 1 score is 97.27%. In addition, despite using the speech signal only, the proposed method behaves com- parably to a method utilizing the glottal signal. The method is also compared with three existing GCI detection algorithms on publicly available databases.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-04420S" target="_blank" >GA16-04420S: Kombinované využití fonetických a korpusově založených postupů při odstraňování rušivých jevů v řečové syntéze</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 18th Annual Conference of the International Speech Communication Association (Interspeech 2017)
ISBN
978-1-5108-4876-4
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
3053-3057
Název nakladatele
Curran Associates, Inc.
Místo vydání
Red Hook, NY
Místo konání akce
Stockholm, Sweden
Datum konání akce
20. 8. 2017
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000457505000631