Comparison of One and Two-Level Architecture of the GMM-Based Speaker Age Classifier
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F16%3A43929603" target="_blank" >RIV/49777513:23520/16:43929603 - isvavai.cz</a>
Výsledek na webu
<a href="http://ieeexplore.ieee.org/document/7760883/" target="_blank" >http://ieeexplore.ieee.org/document/7760883/</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/TSP.2016.7760883" target="_blank" >10.1109/TSP.2016.7760883</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Comparison of One and Two-Level Architecture of the GMM-Based Speaker Age Classifier
Popis výsledku v původním jazyce
The paper describes an experiment using the Gaussian mixture models (GMM) for automatic classification of the speaker age and gender. The developed two-level architecture is compared with the standard one-level GMM classifier in more detail analysing the influence of different number of mixtures and different types of speech features used for GMM gender/age classification and also regarding the computational complexity in dependence on the applied number of used mixtures. Finally, the GMM classification accuracy is compared with the evaluation using the conventional listening test method. The obtained summary results of 92.3 % mean age classification accuracy for the proposed two-level architecture are better than those for the one-level standard architecture (78.7 %) as well as for evaluation by the listening test method (74.6 %). However, the computation complexity in two levels is about twice higher than in one level, either for GMM model creation or for classification phases.
Název v anglickém jazyce
Comparison of One and Two-Level Architecture of the GMM-Based Speaker Age Classifier
Popis výsledku anglicky
The paper describes an experiment using the Gaussian mixture models (GMM) for automatic classification of the speaker age and gender. The developed two-level architecture is compared with the standard one-level GMM classifier in more detail analysing the influence of different number of mixtures and different types of speech features used for GMM gender/age classification and also regarding the computational complexity in dependence on the applied number of used mixtures. Finally, the GMM classification accuracy is compared with the evaluation using the conventional listening test method. The obtained summary results of 92.3 % mean age classification accuracy for the proposed two-level architecture are better than those for the one-level standard architecture (78.7 %) as well as for evaluation by the listening test method (74.6 %). However, the computation complexity in two levels is about twice higher than in one level, either for GMM model creation or for classification phases.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-04420S" target="_blank" >GA16-04420S: Kombinované využití fonetických a korpusově založených postupů při odstraňování rušivých jevů v řečové syntéze</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
2016 39TH INTERNATIONAL CONFERENCE ON TELECOMMUNICATIONS AND SIGNAL PROCESSING (TSP)
ISBN
978-1-5090-1288-6
ISSN
1805-5435
e-ISSN
—
Počet stran výsledku
4
Strana od-do
299-302
Název nakladatele
IEEE
Místo vydání
NEW YORK, NY
Místo konání akce
Vienna, Austria
Datum konání akce
27. 6. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000390164000064