Application of Finite Mixtures to Text Document Classification
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F03%3A03076944" target="_blank" >RIV/68407700:21230/03:03076944 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/67985556:_____/03:16030020
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Application of Finite Mixtures to Text Document Classification
Popis výsledku v původním jazyce
Finite mixture modelling of class-conditional distributions is a standard method in a statistical pattern recognition. We proposed to use the mixture of multinomial distributions as a model for class-conditional distribution for text document classification task. The vector document representations using a bag-of-words or a unigram approach are employed.Experimental comparison of the proposed model and the standard Bernoulli and multinomial models as well as the model based on mixture of multivariate Bernoulli distributions was performed using Reuters-21578 database. Preliminary experimental results indicate the effectiveness of proposed model based on mixture of multinomial distributions in a text classification task.
Název v anglickém jazyce
Application of Finite Mixtures to Text Document Classification
Popis výsledku anglicky
Finite mixture modelling of class-conditional distributions is a standard method in a statistical pattern recognition. We proposed to use the mixture of multinomial distributions as a model for class-conditional distribution for text document classification task. The vector document representations using a bag-of-words or a unigram approach are employed.Experimental comparison of the proposed model and the standard Bernoulli and multinomial models as well as the model based on mixture of multivariate Bernoulli distributions was performed using Reuters-21578 database. Preliminary experimental results indicate the effectiveness of proposed model based on mixture of multinomial distributions in a text classification task.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Znalosti 2003 - sborník příspěvků 2. ročníku konference
ISBN
80-248-0229-5
ISSN
—
e-ISSN
—
Počet stran výsledku
10
Strana od-do
23-32
Název nakladatele
VŠB-TUO
Místo vydání
Ostrava
Místo konání akce
Ostrava
Datum konání akce
19. 2. 2003
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—