Využití skriptů pořadů pro zvýšení kvality živých titulků
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F18%3A43951990" target="_blank" >RIV/49777513:23520/18:43951990 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.kky.zcu.cz/cs/sw/ScriptSystem" target="_blank" >http://www.kky.zcu.cz/cs/sw/ScriptSystem</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Využití skriptů pořadů pro zvýšení kvality živých titulků
Popis výsledku v původním jazyce
Technologie titulkování živých televizních pořadů je často používána i pro pořady, které sice nejsou vysílány živě, nicméně doba mezi jejich výrobou a vysíláním je natolik krátká, že neumožňuje výrobu titulků klasickým offline procesem. V tomto případě ale bývají u televizní společnosti k dispozici textové skripty pořadu. Obvykle se jedná o hrubé texty, které přesně neodpovídají výsledné audiostopě pořadu a obsahují spoustu nepřesností a gramatických chyb, nicméně tyto texty je možno využít jako doplňkový zdroj pro zvýšení kvality živých titulků. Skripty pořadu je možno využít několika způsoby. První možností je automatická extrakce neznámých slov, tedy zejména cizích jmen a názvů, o kterých se bude v pořadu mluvit a která nejsou přítomna ve slovníku rozpoznávacího systému. Tato slova je možno do systému rozpoznávání řeči doplnit před samotným titulkováním. Redukce či úplná eliminace slov mimo slovník zredukuje i prodlevy či výpadky titulků z důvodu přidávání slov stínovým řečníkem v průběhu titulkování. V další fázi je možno stínovému řečníkovi skript pořadu zobrazit v průběhu titulkování. Ve výsledku jde o obdobu čtecího zařízení, přičemž stínový řečník využívá jen relevantní pasáže nepřesného textu. V tomto případě je nutno řešit zejména způsob zobrazení tak, aby byl text automaticky posunován na základě originálního zvuku pořadu.
Název v anglickém jazyce
Using program scripts to improve the quality of live subtitles
Popis výsledku anglicky
The technology of live TV subtitling is often used for programs that are not live, but the time between production and broadcasting is so short that it does not allow subtitling production to be a classic offline process. In this case, however, the text scripts of the program are available at the TV company. Typically, these are rough texts that do not exactly match the audio track of the program and contain a lot of inaccuracies and grammatical errors, but these texts can be used as an additional source to improve the quality of live subtitles. The program scripts can be used in several ways. The first option is the automatic extraction of unknown words, especially foreign names and designations that will be spoken in the program but are not present in the vocabulary of the recognition system. These words can be added to the speech recognition system before the subtitling itself. Reducing or eliminating out-of-vocabulary words also reduces subtitle delays or drop-outs caused by the addition of words by the re-speaker during subtitling. In the next phase, the script can be displayed to the re-speaker during subtitling. It is the equivalent of a reader machine, with the re-speaker using only relevant passages of inaccurate text. In this case, it is necessary to solve the display mode so that the text is automatically shifted based on the original sound of the program.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/EG15_019%2F0004983" target="_blank" >EG15_019/0004983: Vývoj pokročilých přístupů k vytváření titulků a archivaci TV pořadů a dokumentů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
ScriptSystem
Technické parametry
Bližší informace: Josef Psutka, psutka@kky.zcu.cz.
Ekonomické parametry
Software je plánovaným výsledkem řešení projektu CZ.01.1.02/0.0/0.0/15_019/0004983. Software je využíván v procesu online výroby titulků k živých televizním pořadům. Zvýšení kvality živých titulků pro některé pořady díky eliminaci slov mimo slovník systému rozpoznávání řeči a díky automatickému čtecímu zařízení. Výsledek je realizován v rámci služby titulkování živých televizních pořadů provozované společností SpeechTech, s.r.o.
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni