All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Web Topic Summarization

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F08%3A00500629" target="_blank" >RIV/49777513:23520/08:00500629 - isvavai.cz</a>

  • Result on the web

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    angličtina

  • Original language name

    Web Topic Summarization

  • Original language description

    In this paper, we present our online summarization system of web topics. The user defines the topic by a set of keywords. Then the system searches the Web for the relevant documents. The top ranked documents are returned and passed on to the summarization component. The summarizer produces a summary which is finally shown to the user. The proposed architecture is fully modular. This enables us to quickly substitute a new version of any module and thus the quality of the system?s output will get better with module improvements. The crucial module which extracts the most important sentences from the documents is based on the latent semantic analysis. Its main property is independency of the language of the source documents.

  • Czech name

    Sumarizace témat na webu

  • Czech description

    V tomto článku prezentujeme náš online sumarizační systém webových témat. nejprve uživatel definuje téma množinou klíčových slov (dotazem). Potom systém vyhledá relevatní dokumenty na webu. Nejlépe ohodnocené dokumenty tvoří vstup sumarizátoru. Ten vytvoří souhrn, který je nakonec vrácen uživateli spolu s odkazy na plné texty. Navržená architektura je plně modulární, což nám umožňuje rychle substitiovat jakýkoliv modul, ve kterém zaznamenáme určité zlepšení. Klíčový modul sumarizátoru, který extrahuje nejdůležitější věty z dokumentů, je založen na latentní sémantické analýze.

Classification

  • Type

    D - Article in proceedings

  • CEP classification

    JC - Computer hardware and software

  • OECD FORD branch

Result continuities

  • Project

    <a href="/en/project/2C06009" target="_blank" >2C06009: Complex knowledge base tools for natural language communication with the semantic web</a><br>

  • Continuities

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Others

  • Publication year

    2008

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Article name in the collection

    Open scholarship

  • ISBN

    978-0-7727-6315-0

  • ISSN

  • e-ISSN

  • Number of pages

    13

  • Pages from-to

  • Publisher name

    ELPUB

  • Place of publication

    Toronto

  • Event location

    Toronto

  • Event date

    Jun 27, 2008

  • Type of event by nationality

    WRD - Celosvětová akce

  • UT code for WoS article