Fragments and Text Categorization
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F04%3A00010203" target="_blank" >RIV/00216224:14330/04:00010203 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Fragments and Text Categorization
Original language description
We introduce two novel methods of text categorization in which documents are split into fragments. We conducted experiments on English, French and Czech. In all cases, the problems referred to a binary document classification. We find that both methods increase the accuracy of text categorization. For the Naive Bayes classifier this increase is significant.
Czech name
Fragmenty a kategorizace textů
Czech description
Prezentujeme dvě nové metody pro kategorizaci dokumentů za použití fragmentů. Uvádíme výsledky experimentů binární klasifikace anglických, francouzských a českých dokumentů. Obě metody poskytují zlepšení přesnosti, přičemž pro naivní bayesovský klasifikátor je zlepšení statisticky významné.
Classification
Type
D - Article in proceedings
CEP classification
IN - Informatics
OECD FORD branch
—
Result continuities
Project
—
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2004
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
The Companion Volume to the Proceedings of 42st Annual Meeting of the Association for Computational Linguistics
ISBN
1-932432-33-7
ISSN
—
e-ISSN
—
Number of pages
4
Pages from-to
226-229
Publisher name
Association for Computational Linguistics
Place of publication
Barcelona (Spain)
Event location
Barcelona, Spain
Event date
Jul 21, 2004
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—