SAPKOS: Experimental Czech Multi-label Document Classification and Analysis System
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F15%3A43926566" target="_blank" >RIV/49777513:23520/15:43926566 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-319-23868-5_24" target="_blank" >http://dx.doi.org/10.1007/978-3-319-23868-5_24</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-23868-5_24" target="_blank" >10.1007/978-3-319-23868-5_24</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
SAPKOS: Experimental Czech Multi-label Document Classification and Analysis System
Popis výsledku v původním jazyce
The paper presents an experimental multi-label document classification and analysis system called SAPKOS. The system integrates state-of-the-art machine learning and natural language processing approaches and is intended to be used by the Czech news Agency (ČTK). Its main purpose is to save human resources in the task of annotation of newspaper articles with topics. Another important functionality is automatic comparison of the ČTK production with popular Czech media. The results of this analysis will be used to adapt the ČTK production to better correspond to the today's market requirements. The system accuracy is very high due to the unique system architecture which integrates a maximum entropy classifier with the novel confidence measure method.
Název v anglickém jazyce
SAPKOS: Experimental Czech Multi-label Document Classification and Analysis System
Popis výsledku anglicky
The paper presents an experimental multi-label document classification and analysis system called SAPKOS. The system integrates state-of-the-art machine learning and natural language processing approaches and is intended to be used by the Czech news Agency (ČTK). Its main purpose is to save human resources in the task of annotation of newspaper articles with topics. Another important functionality is automatic comparison of the ČTK production with popular Czech media. The results of this analysis will be used to adapt the ČTK production to better correspond to the today's market requirements. The system accuracy is very high due to the unique system architecture which integrates a maximum entropy classifier with the novel confidence measure method.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LO1506" target="_blank" >LO1506: Podpora udržitelnosti centra NTIS - Nové technologie pro informační společnost</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Artificial Intelligence Applications and Innovations
ISBN
978-3-319-23867-8
ISSN
1868-4238
e-ISSN
—
Počet stran výsledku
14
Strana od-do
337-350
Název nakladatele
Springer
Místo vydání
Cham
Místo konání akce
Bayonne, Francie
Datum konání akce
14. 9. 2015
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—