All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Determining topic consistency of a document

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F11%3A00051858" target="_blank" >RIV/00216224:14330/11:00051858 - isvavai.cz</a>

  • Result on the web

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    čeština

  • Original language name

    Určení tematické konzistence dokumentu

  • Original language description

    Cílem této práce bylo navrhnout a implementovat nástroj, který pro libovolný textový dokument v českém jazyce určí, do jaké míry je jeho text tematicky (in)konzistentní a současně rozhodne, zda je vhodné použít jeho odkazy pro výpočet relevance ve fulltextovém vyhledávání (na základě tematické konzistence). Ukazuje se totiž, že by odkazy tematicky nesouroudé webové stránky měly mít menší váhu než odkazy stránky tematicky sourodé. Navržený nástroj je založen na statistických i heuristických metodách a natestovací množině 200 dokumentů dosahuje přesnosti 93,5 %

  • Czech name

    Určení tematické konzistence dokumentu

  • Czech description

    Cílem této práce bylo navrhnout a implementovat nástroj, který pro libovolný textový dokument v českém jazyce určí, do jaké míry je jeho text tematicky (in)konzistentní a současně rozhodne, zda je vhodné použít jeho odkazy pro výpočet relevance ve fulltextovém vyhledávání (na základě tematické konzistence). Ukazuje se totiž, že by odkazy tematicky nesouroudé webové stránky měly mít menší váhu než odkazy stránky tematicky sourodé. Navržený nástroj je založen na statistických i heuristických metodách a natestovací množině 200 dokumentů dosahuje přesnosti 93,5 %

Classification

  • Type

    D - Article in proceedings

  • CEP classification

    IN - Informatics

  • OECD FORD branch

Result continuities

  • Project

    <a href="/en/project/LC536" target="_blank" >LC536: Integrated center for natural language processing</a><br>

  • Continuities

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach

Others

  • Publication year

    2011

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Article name in the collection

    Znalosti 2011

  • ISBN

    978-80-248-2369-0

  • ISSN

  • e-ISSN

  • Number of pages

    338

  • Pages from-to

    148-158

  • Publisher name

    Fakulta elektrotechniky a informatiky, VŠB -- Technická univerzita Ostrava

  • Place of publication

    Ostrava

  • Event location

    Stará lesná

  • Event date

    Jan 1, 2011

  • Type of event by nationality

    EUR - Evropská akce

  • UT code for WoS article