Czech Audio-Visual Speech Corpus for Recognition with Impaired Conditions
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F08%3A00503099" target="_blank" >RIV/49777513:23520/08:00503099 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Czech Audio-Visual Speech Corpus for Recognition with Impaired Conditions
Popis výsledku v původním jazyce
This is an audio-visual speech database for training and testing of Czech audio-visual continuous speech recognition systems collected with impaired illumination conditions. The corpus consists of about 20 hours of audio-visual records of 50 speakers inlaboratory conditions. Recorded subjects were instructed to remain static. The illumination varied and chunks of each speaker were recorded with several different conditions, such as full illumination, or illumination from one side (left or right) only.These conditions make the database usable for training lip-/head-tracking systems under various illumination conditions independently of the language. Speakers were asked to read 200 sentences each (50 common for all speakers and 150 specific to each speaker). The average total length of recording per speaker was 23 minutes. Acoustic data are stored in wave files using PCM format, sampling frequency 44kHz, resolution 16 bits. Each speaker?s acoustic data set represents about 180 MB of di
Název v anglickém jazyce
Czech Audio-Visual Speech Corpus for Recognition with Impaired Conditions
Popis výsledku anglicky
This is an audio-visual speech database for training and testing of Czech audio-visual continuous speech recognition systems collected with impaired illumination conditions. The corpus consists of about 20 hours of audio-visual records of 50 speakers inlaboratory conditions. Recorded subjects were instructed to remain static. The illumination varied and chunks of each speaker were recorded with several different conditions, such as full illumination, or illumination from one side (left or right) only.These conditions make the database usable for training lip-/head-tracking systems under various illumination conditions independently of the language. Speakers were asked to read 200 sentences each (50 common for all speakers and 150 specific to each speaker). The average total length of recording per speaker was 23 minutes. Acoustic data are stored in wave files using PCM format, sampling frequency 44kHz, resolution 16 bits. Each speaker?s acoustic data set represents about 180 MB of di
Klasifikace
Druh
R - Software
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/1ET101470416" target="_blank" >1ET101470416: Multimodální zpracování lidské znakové a mluvené řeči počítačem pro komunikaci člověk-stroj</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
S0284
Technické parametry
SW produkt obsahuje speciálně zpracované záznamy promluv v českém znakovém jazyce pro potřeby trénování systému automatického rozpoznávání znak. řeči. Pro nabytí licence kontaktujte Valerii Mapell prostřednictvím http://www.elda.org/contact.php?recip=vm
Ekonomické parametry
—
IČO vlastníka výsledku
49777513
Název vlastníka
Katedra kybernetiky, Fakulta aplikovaných věd, Západočeská univerzity v Plzni (distribuováno společností ELRA - European Language Resources Association)