Kategorizace textů metodou NBCI
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F03%3A00000078" target="_blank" >RIV/49777513:23520/03:00000078 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Kategorizace textů metodou NBCI
Popis výsledku v původním jazyce
Příspěvek uvádí novou metodu pracujícína principu induktivního strojového učení, jež je kombinací naivní Bayesovy metody a metody Itemsets. Stručně ji lze popsat buďto jako metodu Itemsets používající ke klasifikaci naivní Bayesův klasifikátor, nebo jako naivní Bayesův klasifikátor využívající aproximace vlastních dokumentů častými množinami položek. Implementace této nové robustní metody je poměrně nenáročná. Metoda byla testována na kolekci Reuters-21578. V článku jsou prezentovány výsledky dokladující kvality nové metody.
Název v anglickém jazyce
Text categorization using NBCI method
Popis výsledku anglicky
Research in methods of text categorization and retrieval in digital libraries represents a challenging task. This conference paper introduces a new method based on the principles of inductive machine learning, combining the Naive Bayes classifier and our original Itemsets classification method. We can describe it briefly either as the Itemsets method utilizing Naive Bayes classifier, or as the Naive Bayes Methodapproximating documetns by frequent itemsets. This new and robust method is relatively easyto implement. We have tested the method on Reuters-21578 document collection. Results presented in the paper demonstrate quality of the method being proposed.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Znalosti 2003
ISBN
8024802295
ISSN
—
e-ISSN
—
Počet stran výsledku
10
Strana od-do
33-42
Název nakladatele
VŠB-Technická univerzita
Místo vydání
Ostrava
Místo konání akce
Ostrava
Datum konání akce
19. 2. 2003
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—