Evaluation of Synthetic Speech Quality by Statistical Analysis of Voiced and Unvoiced Part Durations
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F18%3A43952619" target="_blank" >RIV/49777513:23520/18:43952619 - isvavai.cz</a>
Výsledek na webu
<a href="https://ieeexplore.ieee.org/document/8441352" target="_blank" >https://ieeexplore.ieee.org/document/8441352</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/TSP.2018.8441352" target="_blank" >10.1109/TSP.2018.8441352</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Evaluation of Synthetic Speech Quality by Statistical Analysis of Voiced and Unvoiced Part Durations
Popis výsledku v původním jazyce
The paper describes a system for automatic evaluation of differences in time duration, phrasing, and time structuring within an analysed sentence. The proposed system was successfully tested in evaluation of sentences originated from male and female voices and produced by a speech synthesizer using the unit selection method with two different prosody manipulation approaches. A detailed analysis shows great influence of the number of statistical parameters on correctness and precision of evaluated results. Larger size of the processed speech material has positive impact on stability of the evaluation process. The obtained results are in principal correlation with the evaluation based on the standard listening test method.
Název v anglickém jazyce
Evaluation of Synthetic Speech Quality by Statistical Analysis of Voiced and Unvoiced Part Durations
Popis výsledku anglicky
The paper describes a system for automatic evaluation of differences in time duration, phrasing, and time structuring within an analysed sentence. The proposed system was successfully tested in evaluation of sentences originated from male and female voices and produced by a speech synthesizer using the unit selection method with two different prosody manipulation approaches. A detailed analysis shows great influence of the number of statistical parameters on correctness and precision of evaluated results. Larger size of the processed speech material has positive impact on stability of the evaluation process. The obtained results are in principal correlation with the evaluation based on the standard listening test method.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-04420S" target="_blank" >GA16-04420S: Kombinované využití fonetických a korpusově založených postupů při odstraňování rušivých jevů v řečové syntéze</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
2018 41st International Conference on Telecommunications and Signal Processing (TSP)
ISBN
978-1-5386-4695-3
ISSN
—
e-ISSN
neuvedeno
Počet stran výsledku
4
Strana od-do
396-399
Název nakladatele
IEEE
Místo vydání
New York
Místo konání akce
Athens, Greece
Datum konání akce
4. 7. 2018
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000454845100089