All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Oscillating feature subset search algorithm for text categorization

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F67985556%3A_____%2F06%3A00041014" target="_blank" >RIV/67985556:_____/06:00041014 - isvavai.cz</a>

  • Alternative codes found

    RIV/61384399:31160/06:00025098

  • Result on the web

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    angličtina

  • Original language name

    Oscillating feature subset search algorithm for text categorization

  • Original language description

    The usability of the Oscillating Search algorithm for feature/word selection (FS) in text categorization is explored. The multiclass Bhattacharyya distance for multinomial model as the global feature subset selection criterion for reducing the dimensionality of the bag of words vector document represenation is used. This criterion takes into consideration inter-feature relationships. The experiments illustrate that using a non-trivial FS algorithm brings substantial improvement in classification accuracy.

  • Czech name

    Oscilační vyhledávací algoritmus výběru podmnožiny příznaků pro kategorizaci textových dokumentů.

  • Czech description

    Prozkoumána použitelnost oscilačních vyhledávacích algoritmů pro výběr příznaků/slov v problému kategorizace textových dokumentů. Byla použita vícetřídní Bhattacharyya vzdálenost pro multinomický model jako globální kriterium pro výběr podmnožiny slov zaúčelem snížení dimensionality reprezentace dokumentů na základě "balíku slovů". Toto kriterium bere v úvahu vzájemné vztahy mezi slovy v dokumentu. Experimenty ilustrují, že použití netriviálních oscilačních metod pro výběr slov vede k podstatnému zlepšení klasifikační přesnosti.

Classification

  • Type

    J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)

  • CEP classification

    BB - Applied statistics, operational research

  • OECD FORD branch

Result continuities

  • Project

    Result was created during the realization of more than one project. More information in the Projects tab.

  • Continuities

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)

Others

  • Publication year

    2006

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Name of the periodical

    Lecture Notes in Computer Science

  • ISSN

    0302-9743

  • e-ISSN

  • Volume of the periodical

    44

  • Issue of the periodical within the volume

    4225

  • Country of publishing house

    DE - GERMANY

  • Number of pages

    10

  • Pages from-to

    578-587

  • UT code for WoS article

  • EID of the result in the Scopus database