Reduction of Computing Cost in Unit Selection TTS System with Large Corpus
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F09%3A00504521" target="_blank" >RIV/49777513:23520/09:00504521 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Reduction of Computing Cost in Unit Selection TTS System with Large Corpus
Popis výsledku v původním jazyce
Unit selection concatenative speech synthesis requires high amount of computing time, especially for very large corpus. The corpus for our Czech text-to-speech system ARTIC contains over 650 thousands of diphone tokens. Unit selection system with such alarge corpus is not well suitable for run-time speech generation when standard Viterbi search is used. In case of wide-range dialogue systems or other server applications, it is required to dispatch many requests at one moment and this could be problematic in relation to server resources. This paper describes various modifications of Viterbi search algorithm for massive reduction of computation cost in unit selection approach to speech synthesis.
Název v anglickém jazyce
Reduction of Computing Cost in Unit Selection TTS System with Large Corpus
Popis výsledku anglicky
Unit selection concatenative speech synthesis requires high amount of computing time, especially for very large corpus. The corpus for our Czech text-to-speech system ARTIC contains over 650 thousands of diphone tokens. Unit selection system with such alarge corpus is not well suitable for run-time speech generation when standard Viterbi search is used. In case of wide-range dialogue systems or other server applications, it is required to dispatch many requests at one moment and this could be problematic in relation to server resources. This paper describes various modifications of Viterbi search algorithm for massive reduction of computation cost in unit selection approach to speech synthesis.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2009
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Speech Processing
ISBN
978-80-86269-18-4
ISSN
—
e-ISSN
—
Počet stran výsledku
7
Strana od-do
—
Název nakladatele
Institute of Photonics and Electronics AS CR
Místo vydání
Prague
Místo konání akce
Praha
Datum konání akce
1. 1. 2009
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—