All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Mining Relevant Text Documents Using Ranking-Based k-NN Algorithms Trained by Only Positive Examples

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F05%3A00013631" target="_blank" >RIV/00216224:14330/05:00013631 - isvavai.cz</a>

  • Result on the web

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    angličtina

  • Original language name

    Mining Relevant Text Documents Using Ranking-Based k-NN Algorithms Trained by Only Positive Examples

  • Original language description

    The problem of mining relevant information from large numbers of unstructured text documents is often handled with various machine learning algorithms trained using both positive and negative examples that were prepared by an expert in a~given specific domain. However, when just positive examples are available, the task requires algorithms adapted to the different situation. A~modified k-nearest neighbors algorithm, trained using only positive examples, can classify by way of ranking unlabeled instancesdepending on their similarity to training examples. This procedure provides a~significant part of unlabeled positive instances with high precision. The main objective is to find a~method for mining relevant documents from large volumes (hundreds or thousands) of similar medical text files. Experiments and comparisons with various real data obtained from several Internet resources and represented as a bag of words provided---under specific conditions---quite acceptable results from the p

  • Czech name

    Dolování relevantních textových dokumentů algoritmem k-NN trénovaným pouze pomocí pozitivních příkladů

  • Czech description

    Problém dolování relevantních informací z velkého množství nestrukturovaných textů je často řešen pomocí metod strojového učení, které jsou trénovány na pozitivních i negativních příkladech připravených expertem dané oblasti. Avšak pokud jsou k dispozicipouze pozitivní příklady, je třeba tyto algoritmy modifikovat. Metoda k-NN modifikovaná pro učení se pouze z pozitivních příkladů umožňuje klasifikovat neznámé dokumenty formou seřazení na základě jejich podobnosti. Tímto způsobem je možné získat dostatek relevantních dokumentů s velmi vysokou přesností. Hlavním cílem bylo nalézt metodu umožňující dolovat relevantní dokumenty z velkého množství (stovek či tísíců) podobných lékařských textů. Experimenty s reálnými datovými sadami poskytují -- za danýchpodmínek -- přijatelné výsledky z pohledu závislosti přesnosti na pokrytí.

Classification

  • Type

    D - Article in proceedings

  • CEP classification

    IN - Informatics

  • OECD FORD branch

Result continuities

  • Project

  • Continuities

    Z - Vyzkumny zamer (s odkazem do CEZ)

Others

  • Publication year

    2005

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Article name in the collection

    Znalosti 2005, sborník příspěvků

  • ISBN

    80-248-0755-6

  • ISSN

  • e-ISSN

  • Number of pages

    12

  • Pages from-to

    29-40

  • Publisher name

    VŠB--Technická univerzita Ostrava

  • Place of publication

    Ostrava

  • Event location

    Stará Lesná

  • Event date

    Feb 9, 2005

  • Type of event by nationality

    EUR - Evropská akce

  • UT code for WoS article