Implementation of 1D mathematical model of vocal cavities into TTS synthesizer ? preliminary study
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61388998%3A_____%2F12%3A00384265" target="_blank" >RIV/61388998:_____/12:00384265 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/67985882:_____/12:00384265
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Implementation of 1D mathematical model of vocal cavities into TTS synthesizer ? preliminary study
Popis výsledku v původním jazyce
Simplified 1D mathematical models of the human vocal tract were modified for using them in Text-To-Speech systems so that they help to simulate emotional speech. The geometry (area function) of the models for all Czech vowels was modified using the inverse task optimization procedure so that the computed formant frequencies match the measured formant frequencies of utterances of professional speaker. Output acoustic pressure signal generated from the models in wav format sounded satisfactorily for all the vowels and fundamental frequencies varied in an octave range from 77 Hz to 156 Hz. Neverthelles more testing procedures are needed to verify reliability and quickness of the model as well as intelligibility of generated utterances especially in formant TTS system and linear predictive TTS system.
Název v anglickém jazyce
Implementation of 1D mathematical model of vocal cavities into TTS synthesizer ? preliminary study
Popis výsledku anglicky
Simplified 1D mathematical models of the human vocal tract were modified for using them in Text-To-Speech systems so that they help to simulate emotional speech. The geometry (area function) of the models for all Czech vowels was modified using the inverse task optimization procedure so that the computed formant frequencies match the measured formant frequencies of utterances of professional speaker. Output acoustic pressure signal generated from the models in wav format sounded satisfactorily for all the vowels and fundamental frequencies varied in an octave range from 77 Hz to 156 Hz. Neverthelles more testing procedures are needed to verify reliability and quickness of the model as well as intelligibility of generated utterances especially in formant TTS system and linear predictive TTS system.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
BI - Akustika a kmity
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GPP101%2F12%2FP579" target="_blank" >GPP101/12/P579: Akustické rezonanční vlastnosti vokálních dutin - přímá a iverzní úloha</a><br>
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Interaction and Feedbacks 2012
ISBN
978-80-87012-43-7
ISSN
—
e-ISSN
—
Počet stran výsledku
8
Strana od-do
81-89
Název nakladatele
Institute of Thermomechanics AS CR, v. v. i.
Místo vydání
Prague
Místo konání akce
Praha
Datum konání akce
27. 11. 2012
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—