Oscilační vyhledávací algoritmus výběru podmnožiny příznaků pro kategorizaci textových dokumentů.
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F67985556%3A_____%2F06%3A00041014" target="_blank" >RIV/67985556:_____/06:00041014 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/61384399:31160/06:00025098
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Oscillating feature subset search algorithm for text categorization
Popis výsledku v původním jazyce
The usability of the Oscillating Search algorithm for feature/word selection (FS) in text categorization is explored. The multiclass Bhattacharyya distance for multinomial model as the global feature subset selection criterion for reducing the dimensionality of the bag of words vector document represenation is used. This criterion takes into consideration inter-feature relationships. The experiments illustrate that using a non-trivial FS algorithm brings substantial improvement in classification accuracy.
Název v anglickém jazyce
Oscillating feature subset search algorithm for text categorization
Popis výsledku anglicky
The usability of the Oscillating Search algorithm for feature/word selection (FS) in text categorization is explored. The multiclass Bhattacharyya distance for multinomial model as the global feature subset selection criterion for reducing the dimensionality of the bag of words vector document represenation is used. This criterion takes into consideration inter-feature relationships. The experiments illustrate that using a non-trivial FS algorithm brings substantial improvement in classification accuracy.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
BB - Aplikovaná statistika, operační výzkum
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2006
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Lecture Notes in Computer Science
ISSN
0302-9743
e-ISSN
—
Svazek periodika
44
Číslo periodika v rámci svazku
4225
Stát vydavatele periodika
DE - Spolková republika Německo
Počet stran výsledku
10
Strana od-do
578-587
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—