Comparison of Approaches for Information Extraction from the Web
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F08%3A00500844" target="_blank" >RIV/49777513:23520/08:00500844 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Comparison of Approaches for Information Extraction from the Web
Original language description
In this paper we compare two methods for information extraction from the web pages. The first method is based on statistical analysis of web page content and the second one uses the XQueries for information extraction from semi-structured documents.
Czech name
Srovnání přístupů extrakce informací z webu
Czech description
V článku srovnávám dvě metody pro extrakci užitečné informace z webu. První metoda je založena na statistické analýze struktury webové stránky a druhá metoda využívá dotazy XQuery pro extrakci informace z částečně strukturovaných dokomentů.
Classification
Type
D - Article in proceedings
CEP classification
JC - Computer hardware and software
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/2C06009" target="_blank" >2C06009: Complex knowledge base tools for natural language communication with the semantic web</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Proceedings of the 9th international PhD Workshop on Systems and Control
ISBN
978-961-264-003-3
ISSN
—
e-ISSN
—
Number of pages
3
Pages from-to
—
Publisher name
Jožef Stefan Institute
Place of publication
Ljubljana
Event location
Izola
Event date
Oct 3, 2008
Type of event by nationality
EUR - Evropská akce
UT code for WoS article
—