Using Anomaly Detection for Fine Tuning of Formal Prosodic Structures in Speech Synthesis
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F18%3A43952586" target="_blank" >RIV/49777513:23520/18:43952586 - isvavai.cz</a>
Výsledek na webu
<a href="https://link.springer.com/chapter/10.1007/978-3-030-00794-2_44" target="_blank" >https://link.springer.com/chapter/10.1007/978-3-030-00794-2_44</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-030-00794-2_44" target="_blank" >10.1007/978-3-030-00794-2_44</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Using Anomaly Detection for Fine Tuning of Formal Prosodic Structures in Speech Synthesis
Popis výsledku v původním jazyce
Consistent prosody description of speech corpora is a fundamental requirement for a high quality speech synthesis generated by current TTS systems. In this preliminary study, we are using One-class SVM anomaly detection approach to predict formal prosodic structure outliers (a prosodic mismatch) in recorded utterances, that can negatively influence the overall quality of synthesized speech, especially in unit selection. To evaluate the outcome of our detection system, we performed a listening test with encouraging results.
Název v anglickém jazyce
Using Anomaly Detection for Fine Tuning of Formal Prosodic Structures in Speech Synthesis
Popis výsledku anglicky
Consistent prosody description of speech corpora is a fundamental requirement for a high quality speech synthesis generated by current TTS systems. In this preliminary study, we are using One-class SVM anomaly detection approach to predict formal prosodic structure outliers (a prosodic mismatch) in recorded utterances, that can negatively influence the overall quality of synthesized speech, especially in unit selection. To evaluate the outcome of our detection system, we performed a listening test with encouraging results.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/LO1506" target="_blank" >LO1506: Podpora udržitelnosti centra NTIS - Nové technologie pro informační společnost</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Text, Speech, and Dialogue, 21st International Conference, TSD 2018, Brno, Czech Republic, September 11-14, 2018, Proceedings
ISBN
978-3-030-00793-5
ISSN
0302-9743
e-ISSN
neuvedeno
Počet stran výsledku
8
Strana od-do
411-418
Název nakladatele
Springer
Místo vydání
Heidelberg
Místo konání akce
Brno, Czech Republic
Datum konání akce
11. 9. 2018
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—