Using program scripts to improve the quality of live subtitles
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F18%3A43951990" target="_blank" >RIV/49777513:23520/18:43951990 - isvavai.cz</a>
Result on the web
<a href="http://www.kky.zcu.cz/cs/sw/ScriptSystem" target="_blank" >http://www.kky.zcu.cz/cs/sw/ScriptSystem</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Využití skriptů pořadů pro zvýšení kvality živých titulků
Original language description
Technologie titulkování živých televizních pořadů je často používána i pro pořady, které sice nejsou vysílány živě, nicméně doba mezi jejich výrobou a vysíláním je natolik krátká, že neumožňuje výrobu titulků klasickým offline procesem. V tomto případě ale bývají u televizní společnosti k dispozici textové skripty pořadu. Obvykle se jedná o hrubé texty, které přesně neodpovídají výsledné audiostopě pořadu a obsahují spoustu nepřesností a gramatických chyb, nicméně tyto texty je možno využít jako doplňkový zdroj pro zvýšení kvality živých titulků. Skripty pořadu je možno využít několika způsoby. První možností je automatická extrakce neznámých slov, tedy zejména cizích jmen a názvů, o kterých se bude v pořadu mluvit a která nejsou přítomna ve slovníku rozpoznávacího systému. Tato slova je možno do systému rozpoznávání řeči doplnit před samotným titulkováním. Redukce či úplná eliminace slov mimo slovník zredukuje i prodlevy či výpadky titulků z důvodu přidávání slov stínovým řečníkem v průběhu titulkování. V další fázi je možno stínovému řečníkovi skript pořadu zobrazit v průběhu titulkování. Ve výsledku jde o obdobu čtecího zařízení, přičemž stínový řečník využívá jen relevantní pasáže nepřesného textu. V tomto případě je nutno řešit zejména způsob zobrazení tak, aby byl text automaticky posunován na základě originálního zvuku pořadu.
Czech name
Využití skriptů pořadů pro zvýšení kvality živých titulků
Czech description
Technologie titulkování živých televizních pořadů je často používána i pro pořady, které sice nejsou vysílány živě, nicméně doba mezi jejich výrobou a vysíláním je natolik krátká, že neumožňuje výrobu titulků klasickým offline procesem. V tomto případě ale bývají u televizní společnosti k dispozici textové skripty pořadu. Obvykle se jedná o hrubé texty, které přesně neodpovídají výsledné audiostopě pořadu a obsahují spoustu nepřesností a gramatických chyb, nicméně tyto texty je možno využít jako doplňkový zdroj pro zvýšení kvality živých titulků. Skripty pořadu je možno využít několika způsoby. První možností je automatická extrakce neznámých slov, tedy zejména cizích jmen a názvů, o kterých se bude v pořadu mluvit a která nejsou přítomna ve slovníku rozpoznávacího systému. Tato slova je možno do systému rozpoznávání řeči doplnit před samotným titulkováním. Redukce či úplná eliminace slov mimo slovník zredukuje i prodlevy či výpadky titulků z důvodu přidávání slov stínovým řečníkem v průběhu titulkování. V další fázi je možno stínovému řečníkovi skript pořadu zobrazit v průběhu titulkování. Ve výsledku jde o obdobu čtecího zařízení, přičemž stínový řečník využívá jen relevantní pasáže nepřesného textu. V tomto případě je nutno řešit zejména způsob zobrazení tak, aby byl text automaticky posunován na základě originálního zvuku pořadu.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
20205 - Automation and control systems
Result continuities
Project
<a href="/en/project/EG15_019%2F0004983" target="_blank" >EG15_019/0004983: Advanced methods for subtitling and archivation of TV broadcasts and documents</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2018
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
ScriptSystem
Technical parameters
Bližší informace: Josef Psutka, psutka@kky.zcu.cz.
Economical parameters
Software je plánovaným výsledkem řešení projektu CZ.01.1.02/0.0/0.0/15_019/0004983. Software je využíván v procesu online výroby titulků k živých televizním pořadům. Zvýšení kvality živých titulků pro některé pořady díky eliminaci slov mimo slovník systému rozpoznávání řeči a díky automatickému čtecímu zařízení. Výsledek je realizován v rámci služby titulkování živých televizních pořadů provozované společností SpeechTech, s.r.o.
Owner IČO
49777513
Owner name
Západočeská univerzita v Plzni