Distributed index structures for similarity searching
Project goals
With the increasing number of applications that base searching on similarity rather than on exact matching, novel index structures are needed to speedup execution of similarity queries. The computational complexity of similarity retrieval and large volumes of processed data call for distributed processing in order to achieve scalability. The aim of this project is to study problems of distributed systems for similarity searching. Currently available distributed index structures are based on principles of peer-to-peer systems. Even though they offer good scalability, the paradigms they are based on imply an internal structure. Such structures must still decide where to store data - the divide and conquer paradigm is still valid - which naturally impliesa lot of data transfer among the participating nodes. Accepting that some information sources require retaining total control over their data, the underlying search structure paradigm has to change. In this project, we focus on
Keywords
similarity searchscalabilitydistributed index structuremetric spacepeer-to-peer network
Public support
Provider
Czech Science Foundation
Programme
Post-graduate (doctorate) grants
Call for proposals
Postdoktorandské granty 7 (SGA02007GA1PD)
Main participants
—
Contest type
VS - Public tender
Contract ID
201/07/P240
Alternative language
Project name in Czech
Distribuované indexační struktury pro podobnostní hledání
Annotation in Czech
S rostoucím počtem aplikací, které vyhledávají ve svých datech podle podobnostních kriterií než podle přesné shody, se zvyšuje potřeba vývoje nových originálních struktur, které urychlí provádění podobnostních dotazů. Výpočetní náročnost takového hledánía velké objemy zpracovávaných dat, vedou k využití distribuovaného prostředí pro dosažení potřebné míry škálovatelnosti. Cílem tohoto projektu je studium problematiky distribuovaných systémů pro podobnostní hledání. V současné době dostupné distribuovanéindexy jsou založeny na principech peer-to-peer systémů. Ačkoli tato řešení poskytují dobrou škálovatelnost, principy v nich použité vyžadují nějakou vnitřní organizaci. Takové struktury stále musí rozhodovat, kam data ukládat - princip rozděl a panuj jeplatný. To přirozeně přináší mnoho přenosů dat mezi uzly sítě. Akceptujeme-li existenci informačních zdrojů, které vyžadují úplnou kontrolu nad svými daty, současné principy vyhledávání se musí změnit. V tomto projektu se zaměříme na nestrukturované
Scientific branches
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
.
Solution timeline
Realization period - beginning
Jan 1, 2007
Realization period - end
Dec 31, 2009
Project status
U - Finished project
Latest support payment
Apr 22, 2009
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP10-GA0-GP-U/03:3
Data delivery date
Mar 1, 2016
Finance
Total approved costs
501 thou. CZK
Public financial support
501 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
501 CZK thou.
Public support
501 CZK thou.
100%
Provider
Czech Science Foundation
CEP
IN - Informatics
Solution period
01. 01. 2007 - 31. 12. 2009