Very Fast Unit Selection Using Viterbi Search with Zero-Concatenation-Cost Chains
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F14%3A43922773" target="_blank" >RIV/49777513:23520/14:43922773 - isvavai.cz</a>
Výsledek na webu
<a href="http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6854064" target="_blank" >http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6854064</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/ICASSP.2014.6854064" target="_blank" >10.1109/ICASSP.2014.6854064</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Very Fast Unit Selection Using Viterbi Search with Zero-Concatenation-Cost Chains
Popis výsledku v původním jazyce
This paper introduces a very fast heuristic search algorithm for unit-selection speech synthesis. The algorithm modifies commonly used Viterbi search framework by introducing zero-concatenation-cost (ZCC) chains of unit candidates that immediately neighbored in a source speech corpus. ZCC chains are preferred as they represent perfect speech segment concatenations (so there is no need to compute concatenation costs inside the chains) unless a so-called target specification is violated. The number of ZCCchains is reduced based on statistics calculated upon the synthesis of a large number of utterances. ZCC chains are then combined with single unit candidates to fill possible gaps in the sequence of candidates. The proposed method reduces the computational load of a unit selection system up to hundreds of times. According to listening tests, the quality of synthetic speech was not deteriorated.
Název v anglickém jazyce
Very Fast Unit Selection Using Viterbi Search with Zero-Concatenation-Cost Chains
Popis výsledku anglicky
This paper introduces a very fast heuristic search algorithm for unit-selection speech synthesis. The algorithm modifies commonly used Viterbi search framework by introducing zero-concatenation-cost (ZCC) chains of unit candidates that immediately neighbored in a source speech corpus. ZCC chains are preferred as they represent perfect speech segment concatenations (so there is no need to compute concatenation costs inside the chains) unless a so-called target specification is violated. The number of ZCCchains is reduced based on statistics calculated upon the synthesis of a large number of utterances. ZCC chains are then combined with single unit candidates to fill possible gaps in the sequence of candidates. The proposed method reduces the computational load of a unit selection system up to hundreds of times. According to listening tests, the quality of synthetic speech was not deteriorated.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/TA01030476" target="_blank" >TA01030476: Inteligentní technologie pro zvýšení bezpečnosti letového provozu</a><br>
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings - ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing
ISBN
978-1-4799-2893-4
ISSN
1520-6149
e-ISSN
—
Počet stran výsledku
5
Strana od-do
2569-2573
Název nakladatele
IEEE
Místo vydání
New York
Místo konání akce
Florencie, Itálie
Datum konání akce
4. 5. 2014
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000343655302121