Training of Coarticulation Models using Dominance Functions and Visual Unit Selection Methods for Audio-Visual Speech Synthesis
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F06%3A00000016" target="_blank" >RIV/49777513:23520/06:00000016 - isvavai.cz</a>
Alternative codes found
RIV/49777513:23520/06:00500112
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Training of Coarticulation Models using Dominance Functions and Visual Unit Selection Methods for Audio-Visual Speech Synthesis
Original language description
This paper presents results of training of coarticulation models for Czech audio-visual speech synthesis. Two approaches for solution of coarticulation in audio-visual speech synthesis were used, coarticulation based on dominance functions and visual unit selection. For both approaches, coarticulation models were trained. Models for unit selection approach were trained by visualy clustered data. These data were obtained using decision tree algorithm. Outputs of audio-visual speech synthesis for both approaches were assessed and compared objectively.
Czech name
Metoda trénování coartikulačních modelů používající dominanční funkce a výběr jednotek pro audio-vizuální syntézu řeči
Czech description
Tento článek prezentuje výsledky trénování koartikulačních modelů použitých v audio-vizuální syntéze české řeči. Dva postupy řešení jsou použity, koartikulační model založený na dominančních funkcích a na výběru vizuálních jednotek. Oba postupy byly trénovány, postup trénování výběru vizuálních jednotek je založen na binárním rozhodovacím stromu. Oba postupy byly objektivně ohodnoceny.
Classification
Type
J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/1ET101470416" target="_blank" >1ET101470416: Multimodal human sign language and speech processing for man-machine communication</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2006
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Interspeech
ISSN
1990-9772
e-ISSN
—
Volume of the periodical
2006
Issue of the periodical within the volume
—
Country of publishing house
DE - GERMANY
Number of pages
4
Pages from-to
585
UT code for WoS article
—
EID of the result in the Scopus database
—