On the Influence of the Number of Anomalous and Normal Examples in Anomaly-Based Annotation Errors Detection
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F16%3A43929880" target="_blank" >RIV/49777513:23520/16:43929880 - isvavai.cz</a>
Výsledek na webu
<a href="http://link.springer.com/chapter/10.1007%2F978-3-319-45510-5_37" target="_blank" >http://link.springer.com/chapter/10.1007%2F978-3-319-45510-5_37</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-45510-5_37" target="_blank" >10.1007/978-3-319-45510-5_37</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
On the Influence of the Number of Anomalous and Normal Examples in Anomaly-Based Annotation Errors Detection
Popis výsledku v původním jazyce
Anomaly detection techniques were shown to help in detecting word-level annotation errors in read-speech corpora for text-to-speech synthesis. In this framework, correctly annotated words are considered as normal examples on which the detection methods are trained. Misannotated words are then taken as anomalous examples which do not conform to normal patterns of the trained detection models. As it could be hard to collect a sufficient number of examples to train and optimize an anomaly detector, in this paper we investigate the influence of the number of anomalous and normal examples on the detection accuracy of several anomaly detection models: Gaussian distribution based models, one-class support vector machines, and Grubbs’ test based model. Our experiments show that the number of examples can be significantly reduced without a large drop in detection accuracy.
Název v anglickém jazyce
On the Influence of the Number of Anomalous and Normal Examples in Anomaly-Based Annotation Errors Detection
Popis výsledku anglicky
Anomaly detection techniques were shown to help in detecting word-level annotation errors in read-speech corpora for text-to-speech synthesis. In this framework, correctly annotated words are considered as normal examples on which the detection methods are trained. Misannotated words are then taken as anomalous examples which do not conform to normal patterns of the trained detection models. As it could be hard to collect a sufficient number of examples to train and optimize an anomaly detector, in this paper we investigate the influence of the number of anomalous and normal examples on the detection accuracy of several anomaly detection models: Gaussian distribution based models, one-class support vector machines, and Grubbs’ test based model. Our experiments show that the number of examples can be significantly reduced without a large drop in detection accuracy.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-04420S" target="_blank" >GA16-04420S: Kombinované využití fonetických a korpusově založených postupů při odstraňování rušivých jevů v řečové syntéze</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Text, Speech, and Dialogue 19th International Conference, TSD 2016, Brno , Czech Republic, September 12-16, 2016, Proceedings
ISBN
978-3-319-45509-9
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
9
Strana od-do
326-334
Název nakladatele
Springer
Místo vydání
Heidelberg
Místo konání akce
Brno, Česká republika
Datum konání akce
12. 9. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000389707400037