A Framework for Recording Audio-Visual Speech Corpora with a Microphone and a High-Speed Camera
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F14%3A43922935" target="_blank" >RIV/49777513:23520/14:43922935 - isvavai.cz</a>
Výsledek na webu
<a href="http://link.springer.com/chapter/10.1007/978-3-319-11581-8_6" target="_blank" >http://link.springer.com/chapter/10.1007/978-3-319-11581-8_6</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-11581-8_6" target="_blank" >10.1007/978-3-319-11581-8_6</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
A Framework for Recording Audio-Visual Speech Corpora with a Microphone and a High-Speed Camera
Popis výsledku v původním jazyce
In this paper, we present a novel software framework for recording audio-visual speech corpora with a high-speed video camera (JAI Pulnix RMC 6740) and a dynamic microphone (Oktava MK-012). Architecture of the developed software framework for recording audio-visual Russian speech corpus is described. It provides synchronization and fusion of audio and video data captured by the independent sensors. The software automatically detects voice activity in audio signal and stores only speech fragments discarding non-informative signals. It takes into account and processes natural asynchrony of audio-visual speech modalities as well.
Název v anglickém jazyce
A Framework for Recording Audio-Visual Speech Corpora with a Microphone and a High-Speed Camera
Popis výsledku anglicky
In this paper, we present a novel software framework for recording audio-visual speech corpora with a high-speed video camera (JAI Pulnix RMC 6740) and a dynamic microphone (Oktava MK-012). Architecture of the developed software framework for recording audio-visual Russian speech corpus is described. It provides synchronization and fusion of audio and video data captured by the independent sensors. The software automatically detects voice activity in audio signal and stores only speech fragments discarding non-informative signals. It takes into account and processes natural asynchrony of audio-visual speech modalities as well.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/ED1.1.00%2F02.0090" target="_blank" >ED1.1.00/02.0090: NTIS - Nové technologie pro informační společnost</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Speech and Computer, 16th International Conference, SPECOM 2014, Novi Sad, Serbia, October 5-9, 2014, Proceedings
ISBN
978-3-319-11580-1
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
8
Strana od-do
50-57
Název nakladatele
Springer
Místo vydání
Heidelberg
Místo konání akce
Novi Sad, Serbia
Datum konání akce
5. 10. 2014
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—