Confidence Measure for Czech Document Classification
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F15%3A43925838" target="_blank" >RIV/49777513:23520/15:43925838 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-319-18117-2_39" target="_blank" >http://dx.doi.org/10.1007/978-3-319-18117-2_39</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-18117-2_39" target="_blank" >10.1007/978-3-319-18117-2_39</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Confidence Measure for Czech Document Classification
Popis výsledku v původním jazyce
This paper deals with automatic document classification in the context of a real application for the Czech News Agency (ČTK). The accuracy our classifier is high, however it is still important to improve the classification results. The main goal of thispaper is thus to propose novel confidence measure approaches in order to detect and remove incorrectly classified samples. Two proposed methods are based on the posterior class probability and the third one is a supervised approach which uses another classifier to determine if the result is correct. The methods are evaluated on a Czech newspaper corpus. We experimentally show that it is beneficial to integrate the novel approaches into the document classification task because they significantly improvethe classification accuracy.
Název v anglickém jazyce
Confidence Measure for Czech Document Classification
Popis výsledku anglicky
This paper deals with automatic document classification in the context of a real application for the Czech News Agency (ČTK). The accuracy our classifier is high, however it is still important to improve the classification results. The main goal of thispaper is thus to propose novel confidence measure approaches in order to detect and remove incorrectly classified samples. Two proposed methods are based on the posterior class probability and the third one is a supervised approach which uses another classifier to determine if the result is correct. The methods are evaluated on a Czech newspaper corpus. We experimentally show that it is beneficial to integrate the novel approaches into the document classification task because they significantly improvethe classification accuracy.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/ED1.1.00%2F02.0090" target="_blank" >ED1.1.00/02.0090: NTIS - Nové technologie pro informační společnost</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Computational Linguistics and Intelligent Text Processing
ISBN
978-3-319-18116-5
ISSN
—
e-ISSN
—
Počet stran výsledku
10
Strana od-do
525-534
Název nakladatele
Springer
Místo vydání
Cham
Místo konání akce
Cairo
Datum konání akce
14. 4. 2015
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000362442800039