Základy pro zpracování dat s využitím podobností
Cíle projektu
Navržený projekt se zabývá obecným relačním modelem dat v prostředí neurčitosti. Tento model vytváří vhodný prostředek pro práci s pojmy jako jsou podobnostní dotazy, přibližné závislosti v datech a zpracování nepřesné informace. V současnosti jsou tytoa podobné fenomény středem pozornosti, pro jejich plnohodnotné využití však chybí vhodný formální aparát. Navržený projekt se snaží takový aparát vybudovat. Na navrženou teorii lze pohlížet jako na zobecnění Coddova relačního modelu dat, ve kterém jsou datové tabulky obohaceny o ranky řádků a podobnosti na doménách. Model je založen na vícehodnotových logikách a teorii uspořádání což mimo jiné zaručuje řadu výhodných vlastností, rozšířený model dat například zůstává i nadále čistě relační. Mezi cíle projektu patří zkoumat nové typy závislostí mezi daty, formalizovat podobnostní dotazy a analyzovat jejich výpočetní složitost, zkoumat vztah k zobecněnému logickému programování a položit základy novému, kvalitativně jinému, přístupu k analýze relačních dat. Lze očekávat, že teoretické výsledky projektu naleznou v budoucnu další využití.
Klíčová slova
similaritydatabasesystemsinformationretrievalprocessingfuzzylogicdatadependencies
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 14 (SGA02011GA-ST)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
P103-11-1456
Alternativní jazyk
Název projektu anglicky
Foundations of Similarity-Based Data Processing
Anotace anglicky
Proposed is a generalized model of relational data in presence of imprecision that creates a suitable framework for dealing with phenomena like similarity-based queries, approximate dependencies in data, and processing imprecise information. The researchis motivated by the lack of and demand for rigorous and intelligent methods for information processing that reflect the very nature of human understanding of similarity of values of various types. The proposed theory can be seen as an extension of Codd's model of data by introducing tuple ranks and similarities on domains. The extended model remains purely relational as we base the theory on logical concepts borrowed from multiple-valued logics and order theory. The goals of the proposed work include discovering new types of data dependencies, formalization of similarity-based queries, exploring algorithmic and computational issues of the model, establishing links to generalized logic programming, and providing a novel approach to relational data management and analysis. Future applications of the theory are highly anticipated.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
IN - Informatika
CEP - vedlejší obor
JD - Využití počítačů, robotika a její aplikace
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory
(dle převodníku)10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
20204 - Robotics and automatic control
20205 - Automation and control systems
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Projekt rozšířil relační model o rankování a podobnost datových domén. Výsledky projektu jsou 1 příspěvek v impaktovaném časopise a 8 konferenčních článků. Významné výsledky jsou články na konferencích IEEE ICDM (CORE A*) a ACM SAC (CORE B).
Termíny řešení
Zahájení řešení
1. 1. 2011
Ukončení řešení
31. 12. 2013
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
7. 6. 2013
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP14-GA0-GA-U/01:1
Datum dodání záznamu
1. 7. 2014
Finance
Celkové uznané náklady
1 893 tis. Kč
Výše podpory ze státního rozpočtu
1 893 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
1 893 tis. Kč
Statní podpora
1 893 tis. Kč
100%
Poskytovatel
Grantová agentura České republiky
CEP
IN - Informatika
Doba řešení
01. 01. 2011 - 31. 12. 2013