Structured Output SVM Prediction of Apparent Age, Gender and Smile From Deep Features
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F16%3A00304551" target="_blank" >RIV/68407700:21230/16:00304551 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1109/CVPRW.2016.96" target="_blank" >http://dx.doi.org/10.1109/CVPRW.2016.96</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/CVPRW.2016.96" target="_blank" >10.1109/CVPRW.2016.96</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Structured Output SVM Prediction of Apparent Age, Gender and Smile From Deep Features
Popis výsledku v původním jazyce
We propose structured output SVM for predicting the apparent age as well as gender and smile from a single face image represented by deep features. We pose the problem of apparent age estimation as an instance of the multi-class structured output SVM classifier followed by a softmax expected value refinement. The gender and smile predictions are treated as binary classification problems. The proposed solution first detects the face in the image and then extracts deep features from the cropped image around the detected face. We use a convolutional neural network with VGG-16 architecture [25] for learning deep features. The network is pretrained on the ImageNet [24] database and then fine-tuned on IMDB-WIKI [21] and ChaLearn 2015 LAP datasets [8]. We validate our methods on the ChaLearn 2016 LAP dataset [9]. Our structured output SVMs are trained solely on ChaLearn 2016 LAP data. We achieve excellent results for both apparent age prediction and gender and smile classification.
Název v anglickém jazyce
Structured Output SVM Prediction of Apparent Age, Gender and Smile From Deep Features
Popis výsledku anglicky
We propose structured output SVM for predicting the apparent age as well as gender and smile from a single face image represented by deep features. We pose the problem of apparent age estimation as an instance of the multi-class structured output SVM classifier followed by a softmax expected value refinement. The gender and smile predictions are treated as binary classification problems. The proposed solution first detects the face in the image and then extracts deep features from the cropped image around the detected face. We use a convolutional neural network with VGG-16 architecture [25] for learning deep features. The network is pretrained on the ImageNet [24] database and then fine-tuned on IMDB-WIKI [21] and ChaLearn 2015 LAP datasets [8]. We validate our methods on the ChaLearn 2016 LAP dataset [9]. Our structured output SVMs are trained solely on ChaLearn 2016 LAP data. We achieve excellent results for both apparent age prediction and gender and smile classification.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GBP103%2F12%2FG084" target="_blank" >GBP103/12/G084: Centrum pro multi-modální interpretaci dat velkého rozsahu</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
The IEEE Conference on Computer Vision and Pattern Recognition (CVPR) Workshops
ISBN
978-1-5090-1437-8
ISSN
2160-7508
e-ISSN
—
Počet stran výsledku
9
Strana od-do
730-738
Název nakladatele
IEEE
Místo vydání
Piscataway (New Jersey)
Místo konání akce
Las Vegas
Datum konání akce
1. 7. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000391572100089