Detekce prázdných pauz v podmínkách zašuměné a čisté řeči
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26220%2F06%3APU63412" target="_blank" >RIV/00216305:26220/06:PU63412 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Empty pause detection in noisy and clean speech conditions
Popis výsledku v původním jazyce
Successful pause detection becomes an important part in the process of speech recognition and speech coding as well as in the biometrical field (stress detection) and human-machine interaction. Nowadays, only a few of proposed algorithms are able to reflect various noise conditions. This is considered in presented paper which results from research that has been made at the International Institute for Advanced Scientific Studies (IIASS) and proposes novel method for non-speech activity pause detection inspontaneous speech recordings made in noisy environments. The input signal is transformed into log spectral energy and is divided into specific frequency bands. Each band is smoothed and tracked by dynamically adjusted thresholds based on noise energy estimation. Thresholds are adapted taking into account the dynamic changes of the speech signal under environmental noise. The proposed method run in real time and does not require a priori knowledge of the SNR and a priori threshold value
Název v anglickém jazyce
Empty pause detection in noisy and clean speech conditions
Popis výsledku anglicky
Successful pause detection becomes an important part in the process of speech recognition and speech coding as well as in the biometrical field (stress detection) and human-machine interaction. Nowadays, only a few of proposed algorithms are able to reflect various noise conditions. This is considered in presented paper which results from research that has been made at the International Institute for Advanced Scientific Studies (IIASS) and proposes novel method for non-speech activity pause detection inspontaneous speech recordings made in noisy environments. The input signal is transformed into log spectral energy and is divided into specific frequency bands. Each band is smoothed and tracked by dynamically adjusted thresholds based on noise energy estimation. Thresholds are adapted taking into account the dynamic changes of the speech signal under environmental noise. The proposed method run in real time and does not require a priori knowledge of the SNR and a priori threshold value
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JA - Elektronika a optoelektronika, elektrotechnika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2006
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
16th Czech-German Workshop on Speech Processing
ISBN
8086269159
ISSN
—
e-ISSN
—
Počet stran výsledku
130
Strana od-do
125-254
Název nakladatele
Institute of Radio Engineering and Electronics AS CR
Místo vydání
Praha
Místo konání akce
Praha
Datum konání akce
27. 9. 2006
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—