Předzpracování řečového signálu v robustním rozpoznávání řeči
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F07%3A03137187" target="_blank" >RIV/68407700:21230/07:03137187 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Předzpracování řečového signálu v robustním rozpoznávání řeči
Popis výsledku v původním jazyce
V tomto příspěvku jsou shrnuty výsledky práce na zvyšování robustnosti rozpoznávače pomocí hledání optimálního nastavení přezdpracování řečového signálu a kombinace dalších metod, využívaných v úloze robustního rozpoznávání řeči. Článek shrnuje základníexperimenty s modelováním neřečových událostí řečníka, které přináší snížení počtu chybně vložených slov do rozpoznaného textu. V rámci zvyšování odolnosti systému proti šumu jsou testovány základní a modifikované parametrizace a ve fázi předzpracování signálu je také použita detekce řečové aktivity. Jednotlivé přístupy přinášejí dílčí zvýšení robustnosti systému a vedou k volbě vhodného postupu při zpracování řečového signálu pro účely rozpoznávání.
Název v anglickém jazyce
Speech front-end processing for robust speech recognition
Popis výsledku anglicky
This article summarises the work on speech front-end processing and noise-suppression method combination for robust speech recognition. The article describes the experiments on speaker non-speech event modelling. In the next part the standard and modiffied parametrization methods are tested against different noisy conditions and voice activity detection is used for frame-dropping method. Particular techniques bring partial robustness increase and they lead to the optimal speech processing method for robust speech recognition.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JA - Elektronika a optoelektronika, elektrotechnika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Analýza a zpracování řečových a biologických signálů
ISBN
978-80-01-03940-3
ISSN
—
e-ISSN
—
Počet stran výsledku
10
Strana od-do
26-35
Název nakladatele
ČVUT v Praze
Místo vydání
Praha
Místo konání akce
Praha
Datum konání akce
15. 11. 2007
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—