Impact of Microphone on Computer Applications with Voice Input Modality
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F46747885%3A24220%2F13%3A%230002800" target="_blank" >RIV/46747885:24220/13:#0002800 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1109/TSP.2013.6613976" target="_blank" >http://dx.doi.org/10.1109/TSP.2013.6613976</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/TSP.2013.6613976" target="_blank" >10.1109/TSP.2013.6613976</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Impact of Microphone on Computer Applications with Voice Input Modality
Popis výsledku v původním jazyce
In the paper we investigate the impact of different microphones on computer applications that employ voice input, like applications and tools developed for motor-handicapped persons. In order to make their comparison objective, test utterances were recorded always via a pair of microphones, a reference one and a test one. Using this setup, sixty half-minute-long recordings were acquired from 6 persons and via 6 different microphones. These were used in speech recognition tests that revealed quite largeand surprisingly inconsistent impact of the microphones. To compensate the variability between them we examined several techniques for channel and speaker adaptation. With the best one (known as Constricted Maximum Likelihood Linear Regression) we achieved an average absolute improvement of 2.7 % in a voice dictation task.
Název v anglickém jazyce
Impact of Microphone on Computer Applications with Voice Input Modality
Popis výsledku anglicky
In the paper we investigate the impact of different microphones on computer applications that employ voice input, like applications and tools developed for motor-handicapped persons. In order to make their comparison objective, test utterances were recorded always via a pair of microphones, a reference one and a test one. Using this setup, sixty half-minute-long recordings were acquired from 6 persons and via 6 different microphones. These were used in speech recognition tests that revealed quite largeand surprisingly inconsistent impact of the microphones. To compensate the variability between them we examined several techniques for channel and speaker adaptation. With the best one (known as Constricted Maximum Likelihood Linear Regression) we achieved an average absolute improvement of 2.7 % in a voice dictation task.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GPP103%2F11%2FP499" target="_blank" >GPP103/11/P499: Metody adaptace na mluvčího v systémech rozpoznávání řeči</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proc. of 36th International Conference on Telecommunications and Signal Processing (TSP 2013)
ISBN
9781479904044
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
469-473
Název nakladatele
—
Místo vydání
—
Místo konání akce
Itálie
Datum konání akce
1. 1. 2013
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—