Automatická syntéza vizuální řeči - mluvící hlava
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F08%3A00500092" target="_blank" >RIV/49777513:23520/08:00500092 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Automatická syntéza vizuální řeči - mluvící hlava
Popis výsledku v původním jazyce
Disertační práce řeší problém syntézy vizuální složky řeči z textu. Jsou popsány potřebné techniky a metody a uvedeny nové postupy řešení. Je popsána nová technika rekonstrukce 3D tvaru lidské tváře a také metoda animace vhodná pro vyjádření vizuální složky řeči. Disertační práce dále popisuje pořízení dvou audiovizuálních databází. Databáze zachycují spojitou audiovizuální českou řeč od čtyř řečníků. Součástí databází jsou dvě nové metody parametrizace vizuální složky řeči. Zaznamenaná data a jejich zpracování je vhodné pro automatické nastavení systému syntézy vizuální řeči. Disertační práce dále popisuje problematiku řízení animace ze vstupního textu. Je použita jedna stávající metoda řízení a také navržena nové metoda využívající techniku výběru artikulačních cílů. Součástí práce je ohodnocení systému syntézy formou percepčních testů. Výsledky ukazují významný přínos porozumění vytvářené vizuální složky řeči.
Název v anglickém jazyce
Automatic Synthesis of visual Speech - Talking Head
Popis výsledku anglicky
The doctoral thesis addresses the problem of the visual speech synthesis. The new reconstruction technique of 3D shape of human face and the new animation method suitable for the expression of the visual components of speech are introduced. Further the doctoral thesis describes the acquisition of two audiovisual databases. The databases contain audiovisual Czech speech from the 4 speakers. Two new methods are designed for the parameterization of the visual component of speech included in the databases.The doctoral thesis also describes the control of animation from text input. One existing control technique is employed and also a new method using the technique of a selection of articulation targets is proposed. Furthermore the doctoral thesis includesthe perceptual tests of the synthesis system. The results of the tests show a significant contribution to intelligibility of the synthesized visual component of speech.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů