Similarity Searching: Towards Bulk-loading Peer-to-Peer Networks
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F08%3A00024136" target="_blank" >RIV/00216224:14330/08:00024136 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Similarity Searching: Towards Bulk-loading Peer-to-Peer Networks
Original language description
Due to the exponential growth of digital data and its complexity, we need a technique which allows us to search such collections efficiently. A suitable solution is based on the peer-to-peer (P2P) network paradigm and the metric-space model of similarity. When a large volume of data is being inserted, the P2P network must expand to new peers in order to maintain its efficiency. Thus, many peers must be split. During a peer split, the data is halved and one half is migrated to a new peer. In this paper,we study the problem of peer splits and propose a specialized algorithm for speeding it up. In particular, we use the structured P2P network called the M-Chord. Search performance within a single peer is enhanced by the M-tree. In experimental evaluation, we compare the proposed algorithm with several straightforward solutions on a real network organizing 10 million images. Our algorithm provides a significant performance boost.
Czech name
Podobnostní vyhledávání: směrem k efektivnímu budování P2P sítí
Czech description
Díky exponenciálnímu nárustu dat a jejich složitosti, potřebujeme nalézt techniku, která nám umožní efektivně prohledávat takové kolekce dat. Vhodné řešení je založeno na P2P sítích a metrickém přístupu pro modelování podobnosti. Když se vkládá velké množství dat, P2P síť se musí postupně rozšiřovat do většího počtu uzlů, aby dokázala udržet požadovanou výkonnost. Během tohoto procesu se tak se musí spousta uzlů rozdělit. Když se štěpí uzel, data jsou rozdělena na polovinu a jedna půlka je pak přesunutado nově vytvořeného uzlu. V tomto článku studujeme problém štěpení jednoho uzlu a navrhujeme vhodné techniky pro urychlení tohoto procesu. Obzvláště, využíváme P2P síť nazývanou M-Chord. Výkonnost vyhledávání v jednom uzlu je vylepšena lokální indexovoustrukturou nazývanou M-tree. V experimentální části porovnáváme navržený algoritmus s několika přímočarými řešeními na skutečné síti indexující 10 miliónů obrázků.
Classification
Type
D - Article in proceedings
CEP classification
IN - Informatics
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
1st International Workshop on Similarity Search and Applications (SISAP 2008)
ISBN
978-0-7695-3101-4
ISSN
—
e-ISSN
—
Number of pages
8
Pages from-to
—
Publisher name
IEEE Computer Society
Place of publication
Los Alamitos CA, Washington, Tokyo
Event location
Cancun, Mexico
Event date
Apr 11, 2008
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
000255509900010