The phase substitutions in Czech harmonic concatenative speech synthesis
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F03%3A00000196" target="_blank" >RIV/49777513:23520/03:00000196 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
The phase substitutions in Czech harmonic concatenative speech synthesis
Popis výsledku v původním jazyce
This paper describes the issues of the usage of various phase component types in the development of the Czech TTS system based on harmonic sinusoidal signal representation. We have found the approaches for speech representation based on sinusoidal co ding [1] or harmonic plus noise modelling [2] very promising. It is mainly due to possibility of high compression of the spectral representation and possibility to 'smooth' the transitions on the spectral level. The major inconvenience is the nec essity touse natural phase components to reach quality synthesis with preserved naturalness. Trying to interpolate the phase components across the concatenations causes the discontinuities in generated signal. We found that the discontinuities subs tantially degrade the fluency of synthesized speech. We propose the method of substituting the phase components by one locally constant phase component to guarantee the local phase coherence.
Název v anglickém jazyce
The phase substitutions in Czech harmonic concatenative speech synthesis
Popis výsledku anglicky
This paper describes the issues of the usage of various phase component types in the development of the Czech TTS system based on harmonic sinusoidal signal representation. We have found the approaches for speech representation based on sinusoidal co ding [1] or harmonic plus noise modelling [2] very promising. It is mainly due to possibility of high compression of the spectral representation and possibility to 'smooth' the transitions on the spectral level. The major inconvenience is the nec essity touse natural phase components to reach quality synthesis with preserved naturalness. Trying to interpolate the phase components across the concatenations causes the discontinuities in generated signal. We found that the discontinuities subs tantially degrade the fluency of synthesized speech. We propose the method of substituting the phase components by one locally constant phase component to guarantee the local phase coherence.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA102%2F02%2F0124" target="_blank" >GA102/02/0124: Hlasové technologie v podpoře informační společnosti</a><br>
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Text, Speech and Dialogue
ISBN
3-540-20024-X
ISSN
—
e-ISSN
—
Počet stran výsledku
8
Strana od-do
333-340
Název nakladatele
Springer
Místo vydání
Berlin
Místo konání akce
České Budějovice
Datum konání akce
8. 9. 2003
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—