Visual Feature Extraction for Isolated Word Visual Only Speech Recognition of Vietnamese
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F46747885%3A24220%2F13%3A%230002803" target="_blank" >RIV/46747885:24220/13:#0002803 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1109/TSP.2013.6613974" target="_blank" >http://dx.doi.org/10.1109/TSP.2013.6613974</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/TSP.2013.6613974" target="_blank" >10.1109/TSP.2013.6613974</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Visual Feature Extraction for Isolated Word Visual Only Speech Recognition of Vietnamese
Popis výsledku v původním jazyce
This paper presents our research on visual feature extraction with some special treatment for dealing with Vietnamese language. The effect of linear discriminant analysis (LDA) when training with different sets of basic class will be examined. For improving the visual features, we proposed two types of visual front end for automatic lip-reading: (a) 1-Stage LDA visual front end; and (b) hierarchical LDA (HLDA) visual front end. We also compare four different types of visual feature on an isolated word visual only speech recognition of Vietnamese task using our recorded audio-visual speech database. Experiments on our database show that the proposed visual front end improves up to 8% of recognition accuracy and the HLDA visual front end outperform the other.
Název v anglickém jazyce
Visual Feature Extraction for Isolated Word Visual Only Speech Recognition of Vietnamese
Popis výsledku anglicky
This paper presents our research on visual feature extraction with some special treatment for dealing with Vietnamese language. The effect of linear discriminant analysis (LDA) when training with different sets of basic class will be examined. For improving the visual features, we proposed two types of visual front end for automatic lip-reading: (a) 1-Stage LDA visual front end; and (b) hierarchical LDA (HLDA) visual front end. We also compare four different types of visual feature on an isolated word visual only speech recognition of Vietnamese task using our recorded audio-visual speech database. Experiments on our database show that the proposed visual front end improves up to 8% of recognition accuracy and the HLDA visual front end outperform the other.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proc. of 36th International Conference on Telecommunications and Signal Processing (TSP 2013)
ISBN
9781479904044
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
459-463
Název nakladatele
—
Místo vydání
—
Místo konání akce
Itálie
Datum konání akce
1. 1. 2013
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—