All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Data Clustering: From Documents to the Web

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F67985807%3A_____%2F07%3A00048323" target="_blank" >RIV/67985807:_____/07:00048323 - isvavai.cz</a>

  • Result on the web

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    angličtina

  • Original language name

    Data Clustering: From Documents to the Web

  • Original language description

    The chapter provides a survey of some clustering methods relevant to the clustering document collections and, in consequence, Web data. We start with classical methods of cluster analysis which seem to be relevant in approaching to cluster Web data. Thegraph clustering is also described since its methods contribute significantly to clustering Web data. A use of artificial neural networks for clustering has the same motivation. Based on previously presented material, the core of the chapter provides anoverview of approaches to clustering in the Web environment. Particularly, we focus on clustering web search results, in which clustering search engines arrange the search results into groups around a common theme. We conclude with some general considerations concerning the justification of so many clustering algorithms and their application in the Web environment.

  • Czech name

    Shlukování dat: Od dokumentů k Webu

  • Czech description

    Kapitola poskytuje přehled některých shlukovacích metod, včetně jejich principů, vhodných pro shlukování v kolekcích dokumentů a v konečném důsledku i v prostředí internetu, zejména pak v prostředí služby World Wide Web. Posun směrem k webovým aplikacímvedl k zařazení postupů shlukování na grafech, neboť tyto metody jsou velmi užitečné shlukování v prostředí služby WWW. Motivace zařazení metod shlukování založených na neuronových sítích je také motivována rozsáhlostí dat na službě WWW, nezvládnutelnoupomocí klasických algoritmů. Jádrem kapitoly je pak aplikace shlukovaní na výsledky vyhledávání. V závěru jsou uvedeny některé obecné úvahy týkající ospravedlnění existence tak velkého množství shlukovačích algoritmů a jejich aplikace v prostředí službyWWW

Classification

  • Type

    C - Chapter in a specialist book

  • CEP classification

    BB - Applied statistics, operational research

  • OECD FORD branch

Result continuities

  • Project

    Result was created during the realization of more than one project. More information in the Projects tab.

  • Continuities

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)

Others

  • Publication year

    2007

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Book/collection name

    Web data Management Practices. Emerging Techniques and Technologies

  • ISBN

    1-59904229-0

  • Number of pages of the result

    33

  • Pages from-to

    1-22

  • Number of pages of the book

  • Publisher name

    Idea Group Publishing

  • Place of publication

    Hershey

  • UT code for WoS chapter