Experiments with One-Class Classifier as a Predictor of Spectral Discontinuities in Unit Concatenation
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F16%3A43929720" target="_blank" >RIV/49777513:23520/16:43929720 - isvavai.cz</a>
Výsledek na webu
<a href="http://link.springer.com/chapter/10.1007%2F978-3-319-43958-7_35" target="_blank" >http://link.springer.com/chapter/10.1007%2F978-3-319-43958-7_35</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-43958-7_35" target="_blank" >10.1007/978-3-319-43958-7_35</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Experiments with One-Class Classifier as a Predictor of Spectral Discontinuities in Unit Concatenation
Popis výsledku v původním jazyce
We present a sequence of experiments with one-class classification, aimed at examining the ability of such a classifier to detect spectral smoothness of units, as an alternative to heuristics-based measures used within unit selection speech synthesizers. A set of spectral feature distances was computed between neighbouring frames in natural speech recordings, i.e. those representing natural joins, from which the per-vowel classifier was trained. In total, three types of classifiers were examined for distances computed from several different signal parametrizations. For the evaluation, the trained classifiers were tested against smooth or discontinuous joins as they were perceived by human listeners in the ad-hoc listening test designed for this purpose.
Název v anglickém jazyce
Experiments with One-Class Classifier as a Predictor of Spectral Discontinuities in Unit Concatenation
Popis výsledku anglicky
We present a sequence of experiments with one-class classification, aimed at examining the ability of such a classifier to detect spectral smoothness of units, as an alternative to heuristics-based measures used within unit selection speech synthesizers. A set of spectral feature distances was computed between neighbouring frames in natural speech recordings, i.e. those representing natural joins, from which the per-vowel classifier was trained. In total, three types of classifiers were examined for distances computed from several different signal parametrizations. For the evaluation, the trained classifiers were tested against smooth or discontinuous joins as they were perceived by human listeners in the ad-hoc listening test designed for this purpose.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-04420S" target="_blank" >GA16-04420S: Kombinované využití fonetických a korpusově založených postupů při odstraňování rušivých jevů v řečové syntéze</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Speech and Computer 18th International Conference, SPECOM 2016, Budapest, Hungary, August 23-27, 2016, Proceedings
ISBN
978-3-319-43957-0
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
8
Strana od-do
296-303
Název nakladatele
Springer
Místo vydání
Heidelberg
Místo konání akce
Budapesť, Maďarsko
Datum konání akce
23. 8. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000389335600035