Rychlá detekce klíčových slov z ABS
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F06%3A00000023" target="_blank" >RIV/49777513:23520/06:00000023 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Fast Keyword Spotting from Acoustic Baseforms
Popis výsledku v původním jazyce
This paper describes a filler model, used in our keyword spotting system, which is implemented as a phoneme recognizer. The filler model produces a sequence of phones corresponding to the input utterance and can be used as a phoneme recognizer. The dependency of accuracy and correctness on the filler model back loop penalty as well as the influence of the filler model language model are depicted. The output of the phoneme recognizer can be used for keyword spotting. Two modifications of basic DTW algorithm are presented. The advantage of this keyword spotting approach is the possibility of two pass detection. The first pass (slow) is done only once. The second pass (fast) is done on the request of searching the keyword and uses only the sequence of thephones generated by the first pass. All the tests are performed on the telephone speech corpus.
Název v anglickém jazyce
Fast Keyword Spotting from Acoustic Baseforms
Popis výsledku anglicky
This paper describes a filler model, used in our keyword spotting system, which is implemented as a phoneme recognizer. The filler model produces a sequence of phones corresponding to the input utterance and can be used as a phoneme recognizer. The dependency of accuracy and correctness on the filler model back loop penalty as well as the influence of the filler model language model are depicted. The output of the phoneme recognizer can be used for keyword spotting. Two modifications of basic DTW algorithm are presented. The advantage of this keyword spotting approach is the possibility of two pass detection. The first pass (slow) is done only once. The second pass (fast) is done on the request of searching the keyword and uses only the sequence of thephones generated by the first pass. All the tests are performed on the telephone speech corpus.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/1QS101470516" target="_blank" >1QS101470516: Automatické vyhledávání klíčových slov v proudu zvukových dat</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2006
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 11th international conference "Speech and computer" SPECOM'2006
ISBN
5-7452-0074-X
ISSN
—
e-ISSN
—
Počet stran výsledku
21
Strana od-do
79-99
Název nakladatele
Anatolya Publisher
Místo vydání
St. Petersburg
Místo konání akce
St. Peteresburg
Datum konání akce
1. 1. 2006
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—