Efficient Combination of N-gram Language Models and Recognition Grammars in Real-Time LVCSR Decoder
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F08%3A00500705" target="_blank" >RIV/49777513:23520/08:00500705 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Efficient Combination of N-gram Language Models and Recognition Grammars in Real-Time LVCSR Decoder
Popis výsledku v původním jazyce
The paper presents a method for incorporation of regular grammars into n-gram language models. Such composite model then benefits from both language modeling formalisms - a grammar yields robust probability estimates for well-defined phrases with fixed structure whereas the n-gram provides better coverage of casual speech. Moreover, the grammar allows adding new words to the phrase pattern while taking advantage of the existing structural (context) information. The proposed method for grammar incorporation allows the use of combined models in our in-house real-time decoder which is designed to work only with standard n-gram language model. The performance of the combined model was tested in the dictation task where a simple grammar was designed for date entries. A statistically significant improvement of WER was achieved.
Název v anglickém jazyce
Efficient Combination of N-gram Language Models and Recognition Grammars in Real-Time LVCSR Decoder
Popis výsledku anglicky
The paper presents a method for incorporation of regular grammars into n-gram language models. Such composite model then benefits from both language modeling formalisms - a grammar yields robust probability estimates for well-defined phrases with fixed structure whereas the n-gram provides better coverage of casual speech. Moreover, the grammar allows adding new words to the phrase pattern while taking advantage of the existing structural (context) information. The proposed method for grammar incorporation allows the use of combined models in our in-house real-time decoder which is designed to work only with standard n-gram language model. The performance of the combined model was tested in the dictation task where a simple grammar was designed for date entries. A statistically significant improvement of WER was achieved.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/2C06020" target="_blank" >2C06020: Eliminace jazykových bariér handicapovaných diváků České televize</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
9th International Conference on Signal Processing Proceedings
ISBN
978-1-4244-2178-7
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
—
Název nakladatele
IEEE
Místo vydání
Beijing
Místo konání akce
Peking, Čína
Datum konání akce
29. 10. 2008
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000270665400144