Named Entities as New Features for Czech Document Classification
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F14%3A43922596" target="_blank" >RIV/49777513:23520/14:43922596 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-642-54903-8_35" target="_blank" >http://dx.doi.org/10.1007/978-3-642-54903-8_35</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-642-54903-8_35" target="_blank" >10.1007/978-3-642-54903-8_35</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Named Entities as New Features for Czech Document Classification
Popis výsledku v původním jazyce
This paper is focused on automatic document classification. The results will be used to develop a real application for the Czech News Agency. The main goal of this work is to propose new features based on the Named Entities (NEs) for this task. Five different approaches to employ NEs are suggested and evaluated on a Czech newspaper corpus. We show that these features do not improve significantly the score over the baseline word-based features. The classification error rate improvement is only about 0.42% when the best approach is used.
Název v anglickém jazyce
Named Entities as New Features for Czech Document Classification
Popis výsledku anglicky
This paper is focused on automatic document classification. The results will be used to develop a real application for the Czech News Agency. The main goal of this work is to propose new features based on the Named Entities (NEs) for this task. Five different approaches to employ NEs are suggested and evaluated on a Czech newspaper corpus. We show that these features do not improve significantly the score over the baseline word-based features. The classification error rate improvement is only about 0.42% when the best approach is used.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/ED1.1.00%2F02.0090" target="_blank" >ED1.1.00/02.0090: NTIS - Nové technologie pro informační společnost</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Computational Linguistics and Intelligent Text Processing
ISBN
978-3-642-54902-1
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
11
Strana od-do
417-427
Název nakladatele
Springer
Místo vydání
Heidelberg
Místo konání akce
Kathmandu
Datum konání akce
6. 4. 2014
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—