Prosody modelling for TTS systems using statistical methods
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F67985882%3A_____%2F12%3A00396591" target="_blank" >RIV/67985882:_____/12:00396591 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-642-34584-5_13" target="_blank" >http://dx.doi.org/10.1007/978-3-642-34584-5_13</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-642-34584-5_13" target="_blank" >10.1007/978-3-642-34584-5_13</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Prosody modelling for TTS systems using statistical methods
Popis výsledku v původním jazyce
The main drawback of older methods of prosody modelling is the monotony of the output, which is perceived as uncomfortable by the users, especially when listening to longer passages. The present paper proposes a prosodic generator designed to increase the variability of synthesized speech in reading devices for the blind. The method used is based on text segmentation into several prosodic patterns by means of vector quantisation and the subsequent training of corresponding HMMs (Hidden Markov Models) onF0 parameters. The path through the model's states is then used to generate sentence prosody. We also tried to utilize morphological information in order to increase prosody naturalness. The evaluation of the quality of the proposed prosodic generatorswas carried out by means of listening tests
Název v anglickém jazyce
Prosody modelling for TTS systems using statistical methods
Popis výsledku anglicky
The main drawback of older methods of prosody modelling is the monotony of the output, which is perceived as uncomfortable by the users, especially when listening to longer passages. The present paper proposes a prosodic generator designed to increase the variability of synthesized speech in reading devices for the blind. The method used is based on text segmentation into several prosodic patterns by means of vector quantisation and the subsequent training of corresponding HMMs (Hidden Markov Models) onF0 parameters. The path through the model's states is then used to generate sentence prosody. We also tried to utilize morphological information in order to increase prosody naturalness. The evaluation of the quality of the proposed prosodic generatorswas carried out by means of listening tests
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JA - Elektronika a optoelektronika, elektrotechnika
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Lecture Notes i nComputer Science
ISBN
9783642345838
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
10
Strana od-do
174-183
Název nakladatele
Springer Verlag
Místo vydání
Berlin
Místo konání akce
Dresden
Datum konání akce
21. 2. 2011
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—