Detekce řečové aktivity v rozpoznávači řeči s malým slovníkem
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F07%3A03137501" target="_blank" >RIV/68407700:21230/07:03137501 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Voice Activity Detection in Small Vocabulary Speech Recognition
Popis výsledku v původním jazyce
Experiments on using voice activity detection (VAD) as a part of the frame dropping method for suppressing the influence of background noise in speech recognition are presented in this work. A speaker independent phoneme-based Czech digit sequence recogniser working in real environment was used for this purpose. A parametrization-based VAD is used here and the results are compared under different conditions - noisy environment, distribution level and auditory-based signal parametrization. The experiments show, that VAD-based frame dropping signal processing can bring the improvement to the recognition in terms of decreasing the insertion error and increasing the speech model preciseness, reaching for up to 20% word error rate enhancement. But the needfor the universal setting of the detection algorithm for general environmental conditions brings the detection inaccuracy, which takes effect in the recognition results.
Název v anglickém jazyce
Voice Activity Detection in Small Vocabulary Speech Recognition
Popis výsledku anglicky
Experiments on using voice activity detection (VAD) as a part of the frame dropping method for suppressing the influence of background noise in speech recognition are presented in this work. A speaker independent phoneme-based Czech digit sequence recogniser working in real environment was used for this purpose. A parametrization-based VAD is used here and the results are compared under different conditions - noisy environment, distribution level and auditory-based signal parametrization. The experiments show, that VAD-based frame dropping signal processing can bring the improvement to the recognition in terms of decreasing the insertion error and increasing the speech model preciseness, reaching for up to 20% word error rate enhancement. But the needfor the universal setting of the detection algorithm for general environmental conditions brings the detection inaccuracy, which takes effect in the recognition results.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JA - Elektronika a optoelektronika, elektrotechnika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Speech Processing
ISBN
978-80-86269-00-9
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
43-48
Název nakladatele
Institute of Photonics and Electronics AS CR
Místo vydání
Prague
Místo konání akce
Prague
Datum konání akce
19. 9. 2007
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—