Vše
Vše

Co hledáte?

Vše
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Podobnostní vyhledávání s konstantní škálovatelností

Cíle projektu

Díky rozmachu digitálních záznamových zařízení produkuje lidstvo stále více elektronických dat. Tento nárůst se netýká pouze samotného objemu dat, ale také rozmanitosti datových typů. Protože nová data často vyžadují nové postupy zpracování a vyhledávánív nich, je věnováno nemalé úsilí oblasti tzv. podobnostního vyhledávání. Doposud ale nebyl navržen vyhledávací mechanismus, který by byl obecný, dostatečně efektivní a zejména škálovatelný - tedy použitelný pro velké objemy dat. Cílem projektu je nalezení univerzálních a efektivních datových struktur pro podobnostní vyhledávání, které by měly, ideálně, konstantní vyhledávací náklady vzhledem k rostoucímu objemu zpracovávaných dat. Výzkum bude vycházet z našich zkušeností v této oblasti a bude sledovattyto dvě linie: 1) rekurzivní dělení metrického prostoru pomocí fixní množiny pivotů a 2) kombinace několika ortogonálních indexů. Navržené vyhledávací techniky budou implementovány, testovány na reálných datech a použity pro vytvoření několika vyhledávacích systémů, mj. na databázi mající stovky milionů digitálních obrázků.

Klíčová slova

similaritysearchmultimediadatastructurespeer-to-peernetworkscalability

Veřejná podpora

  • Poskytovatel

    Grantová agentura České republiky

  • Program

    Postdoktorandské granty

  • Veřejná soutěž

    Postdoktorandské granty 10 (SGA02010GA1PD)

  • Hlavní účastníci

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    P202-10-P220

Alternativní jazyk

  • Název projektu anglicky

    Efficient Similarity Search with Constant Scalability

  • Anotace anglicky

    Mainly due to the boom of digital recording devices, there is more and more digital data being produced nowadays. This trend of increase is observable in two respects - growing data volumes, and also the variety of data types. Because this new data oftenrequires new approaches to processing and searching, a considerable effort has been put in the area of similarity search. However, a general, efficient and, especially, scalable solution of this issue is still a resisting research challenge. The purposeand goal of this project is to propose universal and efficient data structures for similarity search that would have, ideally, constant search costs with respect to growing data volume. The research will be based upon our experience in this area and will follow two directions: 1) recursive partitioning of metric space using a fixed set of pivots and 2) a combination of several orthogonal indexes. Suggested approaches will be implemented, tested on real data, and used to build several search systems, among others, on a database consisting of hundreds of millions digital images.

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • CEP - hlavní obor

    IN - Informatika

  • CEP - vedlejší obor

  • CEP - další vedlejší obor

  • OECD FORD - odpovídající obory
    (dle převodníku)

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Zhodnocení výsledků projektu

    Cíle projektu byly splněny. Výsledky byly publikovány v mezinárodních časopisech a sbornících mezinárodních konferencí. Počty publikací jsou mírně menší než plánované počty uvedené v grantové přihlášce. Všechny uvedené publikace vznikly v kolektivu více?

Termíny řešení

  • Zahájení řešení

    1. 1. 2010

  • Ukončení řešení

    31. 12. 2012

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    1. 4. 2012

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP13-GA0-GP-U/03:3

  • Datum dodání záznamu

    2. 5. 2016

Finance

  • Celkové uznané náklady

    576 tis. Kč

  • Výše podpory ze státního rozpočtu

    576 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč

Základní informace

Uznané náklady

576 tis. Kč

Statní podpora

576 tis. Kč

100%


Poskytovatel

Grantová agentura České republiky

CEP

IN - Informatika

Doba řešení

01. 01. 2010 - 31. 12. 2012