F0 post-stress rise trends consideration in unit selection TTS
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F18%3A10390114" target="_blank" >RIV/00216208:11210/18:10390114 - isvavai.cz</a>
Výsledek na webu
<a href="https://doi.org/10.1007/978-3-030-00794-2_39" target="_blank" >https://doi.org/10.1007/978-3-030-00794-2_39</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-030-00794-2_39" target="_blank" >10.1007/978-3-030-00794-2_39</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
F0 post-stress rise trends consideration in unit selection TTS
Popis výsledku v původním jazyce
In spoken Czech language, the stress and post-stress syllables in human speech are usually characterized by an increase in fundamental frequency F0 (except for phrase-final stress groups). In unit selection text-to-speech systems, where no contour of F0 is generated to be followed, however, the F0 behaviour is usually tended very vaguely. The paper presents an experiment of making the unit selection TTS to follow the trends of fundamental frequency rise in synthesized speech to achieve higher naturalness and overall quality of speech synthesis itself.
Název v anglickém jazyce
F0 post-stress rise trends consideration in unit selection TTS
Popis výsledku anglicky
In spoken Czech language, the stress and post-stress syllables in human speech are usually characterized by an increase in fundamental frequency F0 (except for phrase-final stress groups). In unit selection text-to-speech systems, where no contour of F0 is generated to be followed, however, the F0 behaviour is usually tended very vaguely. The paper presents an experiment of making the unit selection TTS to follow the trends of fundamental frequency rise in synthesized speech to achieve higher naturalness and overall quality of speech synthesis itself.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-04420S" target="_blank" >GA16-04420S: Kombinované využití fonetických a korpusově založených postupů při odstraňování rušivých jevů v řečové syntéze</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Text, Speech and Dialogue – Lecture Notes in Artificial Intelligence 11107
ISBN
978-3-030-00794-2
ISSN
1611-3349
e-ISSN
neuvedeno
Počet stran výsledku
9
Strana od-do
360-368
Název nakladatele
Springer, Cham
Místo vydání
Switzerland AG 2018
Místo konání akce
Brno
Datum konání akce
11. 9. 2018
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—