Oscillating feature subset search algorithm for text categorization
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F67985556%3A_____%2F06%3A00041014" target="_blank" >RIV/67985556:_____/06:00041014 - isvavai.cz</a>
Alternative codes found
RIV/61384399:31160/06:00025098
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Oscillating feature subset search algorithm for text categorization
Original language description
The usability of the Oscillating Search algorithm for feature/word selection (FS) in text categorization is explored. The multiclass Bhattacharyya distance for multinomial model as the global feature subset selection criterion for reducing the dimensionality of the bag of words vector document represenation is used. This criterion takes into consideration inter-feature relationships. The experiments illustrate that using a non-trivial FS algorithm brings substantial improvement in classification accuracy.
Czech name
Oscilační vyhledávací algoritmus výběru podmnožiny příznaků pro kategorizaci textových dokumentů.
Czech description
Prozkoumána použitelnost oscilačních vyhledávacích algoritmů pro výběr příznaků/slov v problému kategorizace textových dokumentů. Byla použita vícetřídní Bhattacharyya vzdálenost pro multinomický model jako globální kriterium pro výběr podmnožiny slov zaúčelem snížení dimensionality reprezentace dokumentů na základě "balíku slovů". Toto kriterium bere v úvahu vzájemné vztahy mezi slovy v dokumentu. Experimenty ilustrují, že použití netriviálních oscilačních metod pro výběr slov vede k podstatnému zlepšení klasifikační přesnosti.
Classification
Type
J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)
CEP classification
BB - Applied statistics, operational research
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2006
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Lecture Notes in Computer Science
ISSN
0302-9743
e-ISSN
—
Volume of the periodical
44
Issue of the periodical within the volume
4225
Country of publishing house
DE - GERMANY
Number of pages
10
Pages from-to
578-587
UT code for WoS article
—
EID of the result in the Scopus database
—