Analyzér desynchronizace obrazové a syntetizované zvukové stopy TV vysílání
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F11%3A43898327" target="_blank" >RIV/49777513:23520/11:43898327 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Analyzér desynchronizace obrazové a syntetizované zvukové stopy TV vysílání
Popis výsledku v původním jazyce
Jde o nástroj, jehož cílem je analyzovat potenciální míru desynchronizace obrazové a syntetizované zvukové stopy pro dané televizní pořady. Syntetizovaná zvuková stopa obsahuje řeč vytvářenou počítačovým syntetizérem (systémem TTS), jehož vstupem jsou skryté titulky k danému pořadu (vysílané na teletextu 888). V závislosti na typu pořadu (rychlosti dialogů) nejsou systémy TTS vždy schopny dodržet požadované časování. Nástroj tedy analyzuje, jakým způsobem se bude rozbíhat časování uměle vytvářené zvukové stopy oproti zobrazování odpovídajících titulků. Nástroj je rozdělen do dvou modulů: první simuluje vytváření řeči z daných titulků a vytváří záznam o trvání a časovém rozložení této řeči; druhý modul tento záznam zpracovává. Analýzou velkého množstvítitulků pro různé druhy pořadů (a žánrů) je možné získat statistické údaje o desynchronizaci řeči vůči titulkům, na jejichž základě lze pak optimálně naladit systém TTS a off-line upravit tempo řeči nezávisle pro jednotlivé hlasu použité
Název v anglickém jazyce
Tools for analysis of desynchronisation between video and synthesised audio track in TV broadcasting
Popis výsledku anglicky
This software tool is used for analysis of potential level of desynchronisation between video and synthesized audio track for the given TV programs. The synthesized audio track contains speech generated by a speech synthesizer (TTS system). The input ofthat TTS system are the subtitles belonging to the given program. According to the type of program, TTS system are not always capable to keep the required timing. This tool calculates the difference between the timing of generated audio track and of thedefault subtitles. The tool is composed of two basic modules: the first one emulates the synthesis of speech from given subtitles and generates a record of the duration and timing of that speech. The second module processes this record and calculates various statistical indices on speech and subtitles desynchronisation. By analysis of a large amount of subtitles for various types of programes, important statistics for optimal settings of the TTS system can be obtained. As a result, the s
Klasifikace
Druh
R - Software
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/TA01011264" target="_blank" >TA01011264: Eliminace jazykových bariér handicapovaných diváků České televize II</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2011
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
ASdesync
Technické parametry
Software se využívá k analýze desynchronizace (chyb časování) zvukové stopy syntetizované podle titulků. Modul pro simulaci syntézy funguje na běžném kancelářském PC, nicméně vzhledem k časově náročným výpočtům (především při analýze velkého množství titulků, které jsou třeba pro validní závěry) je vhodné použít výkonné výpočetní servery nebo clustery, na kterých tento modul dokáže výpočty paralelizovat a tím výrazně zrychlit. Modul pro analýzu výstupních záznamů nemá žádné zvláštní požadavky na HW. Kesvému běhu potřebuje běhové prostředí programovacího jazyka Python. Součástí programu je též uživatelská dokumentace. Bližší informace: Zdeněk Hanzlíček, zhanzlic@kky.zcu.cz, tel. 377 632 584, http://www.kky.zcu.cz/cs/sw/desync
Ekonomické parametry
Nástroj je výstupem projektu TA01011264 (ELJABR II), kde je jedním z cílů automatické vytváření doprovodné zvukové stopy ze skrytých titulků (automatické dabování). Nástroj je důležitý pro analýzu rozbíhání zvukové stopy s danými titulky. Výsledné statistiky lze využít pro vhodné nastavení parametrů použitého řečového syntetizéru a určení optimální off-line úpravy rychlosti použitého hlasu nebo hlasů. Bližší informace: Zdeněk Hanzlíček, zhanzlic@kky.zcu.cz, 377 632 584, http://www.kky.zcu.cz/cs/sw/desync
IČO vlastníka výsledku
49777513
Název vlastníka
Katedra kybernetiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni