3D lip-tracking for audio-visual speech recognition in real applications
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F04%3A00000149" target="_blank" >RIV/49777513:23520/04:00000149 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
3D lip-tracking for audio-visual speech recognition in real applications
Original language description
In this paper, we present a solution to the problem of tracking 3D information about the shape of lips from 2D picture of a speaker. We focus on lip-tracking of audio-visual speech recordings from the Czech in-vehicle audio-visual speech corpus (CIVAVC).The corpus consists of 4 h 40 min records of audiovisual speech of driver recorded in a car during driving in an usual traffic. In real conditions a head of a speaker (a car driver) can move and turn in various directions. To cope with this movements and to avoid recognition errors caused by changing 3D position of lips, our algorithm utilizes a 3Dmodel- based approach to the lip-tracking process.
Czech name
3D sledování rtů pro audio-vizuální rozpoznávání řeči v reálných aplikacích
Czech description
Článek se zabývá problémem sledování 3D tvaru rtů z 2D obrazu. Procej je zaměřen na sledování rtů v audiovizuálních nahrávkách z korpusu Czech in-vehicle audio-visual speech corpus (CIVAVC). Ve skutčném prostředí automobilu se hlava pohybuje v 3D prostoru. Změna orientace rtů v 3D prostoru zhoršuje výsledky rozpoznávání řeči. Proto jsme vytvořili algoritmus, který využívá 3D model rtů pro sledování jejich tvaru a 3D prostoru.
Classification
Type
J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
—
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2004
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Journal of the Acoustical Society of Korea
ISSN
1225-441X
e-ISSN
—
Volume of the periodical
2004
Issue of the periodical within the volume
—
Country of publishing house
KR - KOREA, REPUBLIC OF
Number of pages
4
Pages from-to
2521
UT code for WoS article
—
EID of the result in the Scopus database
—