Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F03%3A00000205" target="_blank" >RIV/49777513:23520/03:00000205 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation
Popis výsledku v původním jazyce
The task of visual speech synthesis is usually solved by concatenation of basic speech units selected from a visual speech database. There are two main problems in this process. The first problem is a design of a database, that means estimation of the database parameters for all basic speech units. Second problem is a way how to concatenate selected basic phonetic units so as to eliminate the coarticulation effect. Both problems are aimed in our work, resulting in the Czech audio-visual speech synthesizer. We use HMM training process instead of some form of averaging for obtaining statistically best parameters for all basic phonetic units. For solution of a coarticulation effect we use the method of dominance functions.
Název v anglickém jazyce
Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation
Popis výsledku anglicky
The task of visual speech synthesis is usually solved by concatenation of basic speech units selected from a visual speech database. There are two main problems in this process. The first problem is a design of a database, that means estimation of the database parameters for all basic speech units. Second problem is a way how to concatenate selected basic phonetic units so as to eliminate the coarticulation effect. Both problems are aimed in our work, resulting in the Czech audio-visual speech synthesizer. We use HMM training process instead of some form of averaging for obtaining statistically best parameters for all basic phonetic units. For solution of a coarticulation effect we use the method of dominance functions.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA102%2F03%2F0650" target="_blank" >GA102/03/0650: Vizuální syntéza češtiny metodou parametrického modelu jako doplněk řečového syntetizéru</a><br>
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
WSEAS Transactions on Computers
ISSN
1109-2750
e-ISSN
—
Svazek periodika
Vol. 2
Číslo periodika v rámci svazku
—
Stát vydavatele periodika
GR - Řecká republika
Počet stran výsledku
6
Strana od-do
733-738
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—