Improving automatic dubbing with subtitle timing optimisation using video cut detection
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F12%3A43917826" target="_blank" >RIV/49777513:23520/12:43917826 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Improving automatic dubbing with subtitle timing optimisation using video cut detection
Popis výsledku v původním jazyce
This paper presents improvements to an automatic dubbing system in which text-to-speech technology is used to synthesise speech from subtitles. Spring-based subtitle timing optimisation was proposed to reduce the need for speeding up synthetic speech tofit it into corresponding subtitle slots. Video cut detection algorithm was also introduced, and the cuts were then used to prevent stretching subtitles across the cuts. Results show that after the optimisation smaller speeding-up factors are applied onsynthetic speech while keeping optimised subtitle start and end times close to original positions.
Název v anglickém jazyce
Improving automatic dubbing with subtitle timing optimisation using video cut detection
Popis výsledku anglicky
This paper presents improvements to an automatic dubbing system in which text-to-speech technology is used to synthesise speech from subtitles. Spring-based subtitle timing optimisation was proposed to reduce the need for speeding up synthetic speech tofit it into corresponding subtitle slots. Video cut detection algorithm was also introduced, and the cuts were then used to prevent stretching subtitles across the cuts. Results show that after the optimisation smaller speeding-up factors are applied onsynthetic speech while keeping optimised subtitle start and end times close to original positions.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/TA01011264" target="_blank" >TA01011264: Eliminace jazykových bariér handicapovaných diváků České televize II</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings - ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing
ISBN
978-1-4673-0046-9
ISSN
1520-6149
e-ISSN
—
Počet stran výsledku
4
Strana od-do
2385-2388
Název nakladatele
IEEE
Místo vydání
New York
Místo konání akce
Kyoto, Japan
Datum konání akce
25. 3. 2012
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000312381402118