All
All

What are you looking for?

All
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Distributed index structures for similarity searching

Project goals

With the increasing number of applications that base searching on similarity rather than on exact matching, novel index structures are needed to speedup execution of similarity queries. The computational complexity of similarity retrieval and large volumes of processed data call for distributed processing in order to achieve scalability. The aim of this project is to study problems of distributed systems for similarity searching. Currently available distributed index structures are based on principles of peer-to-peer systems. Even though they offer good scalability, the paradigms they are based on imply an internal structure. Such structures must still decide where to store data - the divide and conquer paradigm is still valid - which naturally impliesa lot of data transfer among the participating nodes. Accepting that some information sources require retaining total control over their data, the underlying search structure paradigm has to change. In this project, we focus on

Keywords

similarity searchscalabilitydistributed index structuremetric spacepeer-to-peer network

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Post-graduate (doctorate) grants

  • Call for proposals

    Postdoktorandské granty 7 (SGA02007GA1PD)

  • Main participants

  • Contest type

    VS - Public tender

  • Contract ID

    201/07/P240

Alternative language

  • Project name in Czech

    Distribuované indexační struktury pro podobnostní hledání

  • Annotation in Czech

    S rostoucím počtem aplikací, které vyhledávají ve svých datech podle podobnostních kriterií než podle přesné shody, se zvyšuje potřeba vývoje nových originálních struktur, které urychlí provádění podobnostních dotazů. Výpočetní náročnost takového hledánía velké objemy zpracovávaných dat, vedou k využití distribuovaného prostředí pro dosažení potřebné míry škálovatelnosti. Cílem tohoto projektu je studium problematiky distribuovaných systémů pro podobnostní hledání. V současné době dostupné distribuovanéindexy jsou založeny na principech peer-to-peer systémů. Ačkoli tato řešení poskytují dobrou škálovatelnost, principy v nich použité vyžadují nějakou vnitřní organizaci. Takové struktury stále musí rozhodovat, kam data ukládat - princip rozděl a panuj jeplatný. To přirozeně přináší mnoho přenosů dat mezi uzly sítě. Akceptujeme-li existenci informačních zdrojů, které vyžadují úplnou kontrolu nad svými daty, současné principy vyhledávání se musí změnit. V tomto projektu se zaměříme na nestrukturované

Scientific branches

  • R&D category

    ZV - Basic research

  • CEP classification - main branch

    IN - Informatics

  • CEP - secondary branch

  • CEP - another secondary branch

  • 10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Completed project evaluation

  • Provider evaluation

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Project results evaluation

    .

Solution timeline

  • Realization period - beginning

    Jan 1, 2007

  • Realization period - end

    Dec 31, 2009

  • Project status

    U - Finished project

  • Latest support payment

    Apr 22, 2009

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP10-GA0-GP-U/03:3

  • Data delivery date

    Mar 1, 2016

Finance

  • Total approved costs

    501 thou. CZK

  • Public financial support

    501 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK

Basic information

Recognised costs

501 CZK thou.

Public support

501 CZK thou.

100%


Provider

Czech Science Foundation

CEP

IN - Informatics

Solution period

01. 01. 2007 - 31. 12. 2009