Fast Approximate Spoken Term Detection from Sequence of Phonemes
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F08%3APU80187" target="_blank" >RIV/00216305:26230/08:PU80187 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Fast Approximate Spoken Term Detection from Sequence of Phonemes
Popis výsledku v původním jazyce
We investigate the detection of spoken terms in conversa-<br> tional speech using phoneme recognition with the objective<br> of achieving smaller index size as well as faster search speed.<br> Speech is processed and indexed as a sequence of one best<br>phoneme sequence. We propose the use of a probabilistic<br> pronunciation model for the search term to compensate for<br> the errors in the recognition of phonemes. This model is de-<br> rived using the pronunciation of the word and the phoneme<br> confusion matrix. Experiments are performed on the con-<br> versational telephone speech database distributed by NIST<br> for the 2006 spoken term detection. We achieve about 1500<br> times smaller index size and 14 times faster search speed<br> compared tothe system using phoneme lattices, at the cost<br> of relatively lower detection performance.
Název v anglickém jazyce
Fast Approximate Spoken Term Detection from Sequence of Phonemes
Popis výsledku anglicky
We investigate the detection of spoken terms in conversa-<br> tional speech using phoneme recognition with the objective<br> of achieving smaller index size as well as faster search speed.<br> Speech is processed and indexed as a sequence of one best<br>phoneme sequence. We propose the use of a probabilistic<br> pronunciation model for the search term to compensate for<br> the errors in the recognition of phonemes. This model is de-<br> rived using the pronunciation of the word and the phoneme<br> confusion matrix. Experiments are performed on the con-<br> versational telephone speech database distributed by NIST<br> for the 2006 spoken term detection. We achieve about 1500<br> times smaller index size and 14 times faster search speed<br> compared tothe system using phoneme lattices, at the cost<br> of relatively lower detection performance.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
The 31st Annual International ACM SIGIR Conference 20-24 July 2008, Singapore
ISBN
978-90-365-2697-5
ISSN
—
e-ISSN
—
Počet stran výsledku
8
Strana od-do
—
Název nakladatele
Association for Computing Machinery
Místo vydání
Singapore
Místo konání akce
Singapur
Datum konání akce
20. 7. 2008
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—