Analýza HTML dokumentů pro extrakci informace
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F02%3APU36205" target="_blank" >RIV/00216305:26230/02:PU36205 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
HTML Document Analysis for Information Extraction
Popis výsledku v původním jazyce
The today's World Wide Web contains a vast amount of information stored in HTML documents. However, the HTML language primarily describes the look of the documents and it doesn't contain facilities for the description of contained data structure. In thispaper we propose a model of a Web site that describes logical structure of contained data. Furthermore, we propose methods for creating such a model by analyzing the look and the structure of HTML documents.
Název v anglickém jazyce
HTML Document Analysis for Information Extraction
Popis výsledku anglicky
The today's World Wide Web contains a vast amount of information stored in HTML documents. However, the HTML language primarily describes the look of the documents and it doesn't contain facilities for the description of contained data structure. In thispaper we propose a model of a Web site that describes logical structure of contained data. Furthermore, we propose methods for creating such a model by analyzing the look and the structure of HTML documents.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2002
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of 8th EEICT conference
ISBN
80-214-2116-9
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
426-430
Název nakladatele
Faculty of Information Technology BUT
Místo vydání
Brno
Místo konání akce
FEKT VUT Brno
Datum konání akce
25. 4. 2002
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—