Web Topic Summarization
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F08%3A00500629" target="_blank" >RIV/49777513:23520/08:00500629 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Web Topic Summarization
Original language description
In this paper, we present our online summarization system of web topics. The user defines the topic by a set of keywords. Then the system searches the Web for the relevant documents. The top ranked documents are returned and passed on to the summarization component. The summarizer produces a summary which is finally shown to the user. The proposed architecture is fully modular. This enables us to quickly substitute a new version of any module and thus the quality of the system?s output will get better with module improvements. The crucial module which extracts the most important sentences from the documents is based on the latent semantic analysis. Its main property is independency of the language of the source documents.
Czech name
Sumarizace témat na webu
Czech description
V tomto článku prezentujeme náš online sumarizační systém webových témat. nejprve uživatel definuje téma množinou klíčových slov (dotazem). Potom systém vyhledá relevatní dokumenty na webu. Nejlépe ohodnocené dokumenty tvoří vstup sumarizátoru. Ten vytvoří souhrn, který je nakonec vrácen uživateli spolu s odkazy na plné texty. Navržená architektura je plně modulární, což nám umožňuje rychle substitiovat jakýkoliv modul, ve kterém zaznamenáme určité zlepšení. Klíčový modul sumarizátoru, který extrahuje nejdůležitější věty z dokumentů, je založen na latentní sémantické analýze.
Classification
Type
D - Article in proceedings
CEP classification
JC - Computer hardware and software
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/2C06009" target="_blank" >2C06009: Complex knowledge base tools for natural language communication with the semantic web</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Open scholarship
ISBN
978-0-7727-6315-0
ISSN
—
e-ISSN
—
Number of pages
13
Pages from-to
—
Publisher name
ELPUB
Place of publication
Toronto
Event location
Toronto
Event date
Jun 27, 2008
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—