Titulkování živých televizních pořadů - rychlý dvouprůchodový LVCSR systém pro online titulkování
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F07%3A00000324" target="_blank" >RIV/49777513:23520/07:00000324 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
LIVE TV SUBTITLING - Fast 2-pass LVCSR System for Online Subtitling
Popis výsledku v původním jazyce
The paper describes a fast 2-pass large vocabulary continuous speech recognition (LVCSR) system for automatic online subtitling of live TV programs. The proposed system implementation can be used for direct recognition of TV program audio channel or recognition of a shadow speaker who re-speaks the original audio channel. The first part of this paper focuses on preparation of an adaptive language model for TV programs, where person names are specific for each subtitling session and have to be added to the recognition vocabulary. The second part outlines the recognition system conception for automatic online subtitling with vocabulary up to 150 000 words in real-time. The recognition system is based on Hidden Markov Models, lexical trees and bigram andquadgram language models in the first and second pass, respectively. Finally, experimental results from our project with the Czech Television are reported and discussed.
Název v anglickém jazyce
LIVE TV SUBTITLING - Fast 2-pass LVCSR System for Online Subtitling
Popis výsledku anglicky
The paper describes a fast 2-pass large vocabulary continuous speech recognition (LVCSR) system for automatic online subtitling of live TV programs. The proposed system implementation can be used for direct recognition of TV program audio channel or recognition of a shadow speaker who re-speaks the original audio channel. The first part of this paper focuses on preparation of an adaptive language model for TV programs, where person names are specific for each subtitling session and have to be added to the recognition vocabulary. The second part outlines the recognition system conception for automatic online subtitling with vocabulary up to 150 000 words in real-time. The recognition system is based on Hidden Markov Models, lexical trees and bigram andquadgram language models in the first and second pass, respectively. Finally, experimental results from our project with the Czech Television are reported and discussed.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/2C06020" target="_blank" >2C06020: Eliminace jazykových bariér handicapovaných diváků České televize</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
SIGMAP 2007
ISBN
978-989-8111-13-5
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
139-142
Název nakladatele
INSTICC PRESS
Místo vydání
Lisabon
Místo konání akce
Barcelona
Datum konání akce
1. 1. 2007
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—