The possibilities of time scale modification of speech
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F09%3A00504528" target="_blank" >RIV/49777513:23520/09:00504528 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
The possibilities of time scale modification of speech
Popis výsledku v původním jazyce
The present paper deals with time-scale modifications of speech. The aim is to utilize high quality speech signal stretching method into the project ELJABR, or more specifically, into the part of project including automatic audio track generation. The audio track is produced from subtitles by TTS (text-to-speech) system, and one of the most frequented problems is that synthetic speech often exceeds the time slot in which subtitles are displayed. Therefore, the length of synthetic speech and time-slot ofsubtitles must be synchronized, mostly by increasing the speed of synthetic speech, while the quality of speech must be kept. This issue can be solved by WSOLA technique.
Název v anglickém jazyce
The possibilities of time scale modification of speech
Popis výsledku anglicky
The present paper deals with time-scale modifications of speech. The aim is to utilize high quality speech signal stretching method into the project ELJABR, or more specifically, into the part of project including automatic audio track generation. The audio track is produced from subtitles by TTS (text-to-speech) system, and one of the most frequented problems is that synthetic speech often exceeds the time slot in which subtitles are displayed. Therefore, the length of synthetic speech and time-slot ofsubtitles must be synchronized, mostly by increasing the speed of synthetic speech, while the quality of speech must be kept. This issue can be solved by WSOLA technique.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/2C06020" target="_blank" >2C06020: Eliminace jazykových bariér handicapovaných diváků České televize</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2009
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Speech Processing
ISBN
978-80-86269-18-4
ISSN
—
e-ISSN
—
Počet stran výsledku
7
Strana od-do
—
Název nakladatele
Institute of Photonics and Electronics AS CR
Místo vydání
Prague
Místo konání akce
Praha
Datum konání akce
1. 1. 2009
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—