Substituce fáze v české harmonické konkatenační syntéze řeči.
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F03%3A00000252" target="_blank" >RIV/49777513:23520/03:00000252 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/49777513:23520/03:00000054
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
The phase substitutions in Czech harmonic concatenative speech synthesis
Popis výsledku v původním jazyce
This paper describes the issues of the usage of various phase component types in the development of the Czech TTS system based on harmonic sinusoidal signal representation. We have found the approaches for speech representation based on sinusoidal coding[1] or harmonic plus noise modelling [2] very promising. It is mainly due to possibility of high compression of the spectral representation and possibility to 'smooth' the transitions on the spectral level. The major inconvenience is the necessity to use natural phase components to reach quality synthesis with preserved naturalness. Trying to interpolate the phase components across the concatenations causes the discontinuities in generated signal. We found that the discontinuities substantially degradethe fluency of synthesized speech. We propose the method of substituting the phase components by one locally constant phase component to guarantee the local phase coherence.
Název v anglickém jazyce
The phase substitutions in Czech harmonic concatenative speech synthesis
Popis výsledku anglicky
This paper describes the issues of the usage of various phase component types in the development of the Czech TTS system based on harmonic sinusoidal signal representation. We have found the approaches for speech representation based on sinusoidal coding[1] or harmonic plus noise modelling [2] very promising. It is mainly due to possibility of high compression of the spectral representation and possibility to 'smooth' the transitions on the spectral level. The major inconvenience is the necessity to use natural phase components to reach quality synthesis with preserved naturalness. Trying to interpolate the phase components across the concatenations causes the discontinuities in generated signal. We found that the discontinuities substantially degradethe fluency of synthesized speech. We propose the method of substituting the phase components by one locally constant phase component to guarantee the local phase coherence.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA102%2F02%2F0124" target="_blank" >GA102/02/0124: Hlasové technologie v podpoře informační společnosti</a><br>
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Lecture Notes in Artificial Intelligence
ISSN
0302-9743
e-ISSN
—
Svazek periodika
—
Číslo periodika v rámci svazku
—
Stát vydavatele periodika
DE - Spolková republika Německo
Počet stran výsledku
8
Strana od-do
333
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—