Collection and Preprocessing of Czech Sign Language Corpus for Sign Language Recognition
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F08%3A00500083" target="_blank" >RIV/49777513:23520/08:00500083 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Collection and Preprocessing of Czech Sign Language Corpus for Sign Language Recognition
Original language description
This paper discusses the design, recording and preprocessing of a Czech sign language corpus. The corpus is intended for training and testing of sign language recognition (SLR) systems. The UWB-07-SLR-P corpus contains video data of 4 signers recorded from 3 different perspectives. Two of the perspectives contain whole body and provide 3D motion data, the third one is focused on signer?s face and provide data for face expression and lip feature extraction. Each signer performed 378 signs with 5 repetitions. The corpus consists of several types of signs: numbers (35 signs), one and two-handed finger alphabet (64), town names (35) and other signs (244). Each sign is stored in a separate AVI file. In total the corpus consists of 21853 video files in totallength of 11.1 hours. Additionally each sign is preprocessed and basic features such as 3D hand and head trajectories are available.
Czech name
Tvorba a předzpracování korpusu českého znakového jazyka pro automatické rozpoznávání znakového jazyka
Czech description
Tento článek popisuje tvorbu, nahrávání a předzpracování korpusu českého znakového jazyka. Korpus slouží pro trénování a testování automatických systémů pro rozpoznávání znakového jazyka. Tento korpus UWB-07-SLP-P obsahuje videonahrávky 4 znakujících osob, které jsou nasnímány za 3 pohledů. Dva z nich zachytávají celou osobu, třetí je zaměřena na obličej. Každý znakující provedl 378 znaků, každý pětkrát opakován. Korpus obsahuje celkem 21853 videosouborů v délce 11,1 hodin. Každý znak je předzpracován ajsou dostupné základní příznaky, jako např. trajektorie rukou v 3D prostoru.
Classification
Type
D - Article in proceedings
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/1ET101470416" target="_blank" >1ET101470416: Multimodal human sign language and speech processing for man-machine communication</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC'08)
ISBN
2-9517408-4-0
ISSN
—
e-ISSN
—
Number of pages
4
Pages from-to
—
Publisher name
ELRA
Place of publication
Paris
Event location
—
Event date
—
Type of event by nationality
—
UT code for WoS article
—