Podobnostní nemetrické vyhledávání v rozsáhlých komplexních databázích
Cíle projektu
Podobnostní vyhledávání našlo své uplatnění v mnoha oblastech informatiky, jako jsou např. multimediální databáze, dolování z dat, bioinformatika, atd. Po dlouhou dobu předpokládal databázový výzkum zjednodušený - metrický - model podobnosti. Díky axiomům metriky lze databázi indexovat tak, aby podobnostní dotazy mohly být vykonány efektivně (rychle). V posledních letech se nicméně stále více objevují domény (často mimo informatiku), kde míra podobnosti není svázána metrickými axiomy, tj. je nemetrikou.Databázový výzkum zatím tento trend nereflektuje a jeho výsledky stále zůstávají založeny na předpokladu metrického modelu podobnosti. Tento projekt si klade za cíl navrhnout formální modely a následně metody pro efektivní nemetrické podobnostní vyhledávání, tj. chce metody podobnostního vyhledávání zobecnit odstraněním požadavku na metrickou podobnost. Dosažení tohoto cíle by přineslo užitek doménovým expertům, kteří potřebují (nebo v budoucnu budou potřebovat) provádět podobnostní vyhledávání v rozsáhlých a složitých databázích, např. multimediálních databázích, jako součást podobnostního dolování z dat, složitého vyhledávání vzorů, klasifikaci a predikci v bioinformatice, atd.
Klíčová slova
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 14 (SGA02011GA-ST)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
P202-11-0968
Alternativní jazyk
Název projektu anglicky
Large-scale Nonmetric Similarity Search in Complex Domains
Anotace anglicky
The similarity search is popular in various areas of computing, including multimedia databases, data mining, bioinformatics, etc. For a long time, the database approaches to similarity search assumed the similarity as a metric distance. Due to its properties, metric similarity allows to index a database such that it can be queried efficiently (quickly). However, together with the increasing complexity of data across various domains, there appeared many similarities in recent years that were not metrics(i.e., nonmetrics). The database research, however, is still not aware of the huge potential market for nonmetric similarity search, recognizing just the metric space model. This project aims to propose formal models followed by a design of access methods for efficient nonmetric similarity search, that is, search in databases where the similarity is not restricted by the metric postulates. Such a goal would bring an efficient database solution to the domain experts that need to pursue large-scale content-based retrieval tasks in complex databases, like multimedia retrieval, similarity-based data mining, complex pattern matching, classification and prediction in bioinformatics, etc.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
IN - Informatika
CEP - vedlejší obor
—
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory
(dle převodníku)10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Výsledkem projektu bylo několik metod v oblasti efektivního nemetrického vyhledávání. Cíle byly splněny, publikační výstupy jsou kvalitní. Mezi publikacemi je několik ve velmi kvalitních časopisech. Některé publikace v kategorii Jsc, zejména Lecture Not?
Termíny řešení
Zahájení řešení
1. 1. 2011
Ukončení řešení
31. 12. 2014
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
18. 4. 2014
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP15-GA0-GA-U/01:1
Datum dodání záznamu
22. 5. 2015
Finance
Celkové uznané náklady
6 401 tis. Kč
Výše podpory ze státního rozpočtu
6 401 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Uznané náklady
6 401 tis. Kč
Statní podpora
6 401 tis. Kč
0%
Poskytovatel
Grantová agentura České republiky
CEP
IN - Informatika
Doba řešení
01. 01. 2011 - 31. 12. 2014