Adaptivní jazykový model v automatickém online titulkování
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F25247930%3A_____%2F06%3A%230000018" target="_blank" >RIV/25247930:_____/06:#0000018 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Adaptivní jazykový model v automatickém online titulkování
Popis výsledku v původním jazyce
V článku je popsán adaptivní jazykový model pro rozpoznávací úlohy, ve kterých jsou osobní jména specifická pro každé rozpoznávání a musí být přidána do rozpoznávacího slovníku. Tvorba adaptivního jazykového modelu se slovními (jmennými) třídami je ilustrována na dvou rozdílných úlohách automatického titulkování: titulkování parlamentních zasedání(1,5 % jmen) a zápasů ledního hokeje (15 % jmen). Druhá část článku se zabývá systémem pro automatické online titulkování se slovníkem do 100000 slov v reálnémčase. Rozpoznávací systém je založen na Skrytých Markovových modelech, lexikálních stromech a bigramovém jazykovém modelu. Závěrem jsou podány a diskutovány experimentální výsledky s a bez adaptivního jazykového modelu.
Název v anglickém jazyce
Adaptive Language Model in Automatic Online Subtitling
Popis výsledku anglicky
This paper describes an adaptive language model for recognition tasks, where person names are specific for each recognition session and have to be added to the recognition vocabulary. Creation of an adaptive language model with word (name) classes is illustrated on two different tasks of automatic online subtitling: subtitling of parliament meetings (1.5 % of names) and ice-hockey matches (15 % of names). The second part outlines the system for automatic online subtitling with vocabulary up to 100 000 words in real-time. The recognition system is based on Hidden Markov Models, lexical trees and bigram language model. Finally, experimental results with and without the adaptive language model are reported and discussed.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/2C06020" target="_blank" >2C06020: Eliminace jazykových bariér handicapovaných diváků České televize</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2006
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the second IASTED international conference on Computational intelligence
ISBN
0-88986-602-3
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
479-483
Název nakladatele
ACTA Press
Místo vydání
Anaheim
Místo konání akce
San Francisco, USA
Datum konání akce
20. 11. 2006
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—