Measuring Web Page Similarity Based on Textual and Visual Properties
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F12%3APU96212" target="_blank" >RIV/00216305:26230/12:PU96212 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Measuring Web Page Similarity Based on Textual and Visual Properties
Popis výsledku v původním jazyce
Measuring web page similarity is a very important task in the area of web mining and information retrieval. This paper introduces the method for measuring web page similarity, which considers both textual and visual properties of pages. Textual properties of a page are described by means of modified weight vector space model. General visual properties are captured via segmentation of a page, which divides a page into visual blocks, properties of which are stored into a vector of visual properties. Theseboth vectors are then used to compute the whole web page similarity. This method will be described in detail and results of several experiments are also introduced in this paper.
Název v anglickém jazyce
Measuring Web Page Similarity Based on Textual and Visual Properties
Popis výsledku anglicky
Measuring web page similarity is a very important task in the area of web mining and information retrieval. This paper introduces the method for measuring web page similarity, which considers both textual and visual properties of pages. Textual properties of a page are described by means of modified weight vector space model. General visual properties are captured via segmentation of a page, which divides a page into visual blocks, properties of which are stored into a vector of visual properties. Theseboth vectors are then used to compute the whole web page similarity. This method will be described in detail and results of several experiments are also introduced in this paper.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
The 11th International Conference on Artificial Intelligence and Soft Computing
ISBN
978-3-642-29349-8
ISSN
—
e-ISSN
—
Počet stran výsledku
9
Strana od-do
13-21
Název nakladatele
Springer Verlag
Místo vydání
Zakopane
Místo konání akce
Zakopane
Datum konání akce
29. 4. 2012
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000314151300002