Extending the single words-based document model: a comparison of bigrams and 2itemsets
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F06%3A00000296" target="_blank" >RIV/49777513:23520/06:00000296 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Extending the single words-based document model: a comparison of bigrams and 2itemsets
Original language description
We compare the performance improvement in terms of classification accuracy when bigrams and 2-itemsets are used to extend the single words-based document representation on two standard text corpora: Reuters-21578 and 20Newsgroups. Algoritms for bigrams and 2-itemsets discovery are presented as well.
Czech name
Rozšíření bag-of-words modelu dokumentu:srovnání bigramů a 2-itemsetů
Czech description
V článku je srovnáno zvýšení celkové úspěšnosti klasifikace textu při rozšíření bag-of-words modelu dokumentu o bigramy a 2-itemsety na dvou standardizovaných kolekcích: Reuters21578 a 20Newsgroups. Zároveň jsou prezentovány i algoritmy pro hledání bigramů a 2-itemsetů.
Classification
Type
D - Article in proceedings
CEP classification
JC - Computer hardware and software
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/2C06009" target="_blank" >2C06009: Complex knowledge base tools for natural language communication with the semantic web</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2006
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Proceedings of the 2006 ACM symposium on Document engineering
ISBN
1-59593-515-0
ISSN
—
e-ISSN
—
Number of pages
9
Pages from-to
138-146
Publisher name
ACM
Place of publication
New York
Event location
Amsterdam
Event date
Jan 1, 2006
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—