Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F03%3A00000256" target="_blank" >RIV/49777513:23520/03:00000256 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation
Original language description
The task of visual speech synthesis is usually solved by concatenation of basic speech units selected from a visual speech database. There are two main problems in this process. The first problem is a design of a database, that means estimation of the database parameters for all basic speech units. Second problem is a way how to concatenate selected basic phonetic units so as to eliminate the coarticulation effect. Both problems are aimed in our work, resulting in the Czech audio-visual speech synthesizer. We use HMM training process instead of some form of averaging for obtaining statistically best parameters for all basic phonetic units. For solution of a coarticulation effect we use the method of dominance functions.
Czech name
Česká audiovizuální syntéza řeči
Czech description
Syntéza vizuální řeči je většinou řešena konkatenací základních řečových jednotek vybíraných z databáze. Existují obecně dva hlavní problémy. Prvním je návrh vizuální databáze spolu s estimací hodnot řídicích parametrů. Druhý problém je je vlastní spojování jednotek. Oba problémy jsou řešeny v tomto článku a je navržena nová vizuální syntéza češtiny pomocí statistického přístupu. Je využito skrytých Markovových modelů (HMM) a dominančních funkcí pro řešení koartikulace.
Classification
Type
D - Article in proceedings
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
—
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2003
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Digest of the Proceedings of the WSEAS Conferences
ISBN
960-8052-90-4
ISSN
—
e-ISSN
—
Number of pages
6
Pages from-to
4631741-4631746
Publisher name
WSEAS
Place of publication
Rethymno
Event location
Rethymno
Event date
Jan 1, 2003
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—