Methods for efficient searching in large collections of semi-structured data

Project name in Czech
Metody pro efektivní vyhledávání v rozsáhlých kolekcích slabě strukturovaných dat
Annotation in Czech
Značkovací jazyk XML (Extensible Markup Language) přinesl formalizovaný nástroj pro popis slabě strukturovaných dat. XML může sloužit jako prostředek pro výměnu dat, prezentaci dokumentů v prostředí Internetu apod. Z pohledu databázové technologie můžemeXML chápat jako jazyk pro modelování dat. Implementace systémů vhodných pro efektivní uložení a dotazování XML dokumentů (tzv. nativní XML databáze) vyžaduje vývoj nových technik. XML dokument může být modelován jako graf a XML dotazovací jazyky umožňujíprocházet tímto grafem zadáním výrazu cesty. Jelikož cesty je možné specifikovat regulárním výrazem, popř. mohou být použity další komplikovanější dotazy, je použití stávajících databázových přístupů pro vykonávání takových dotazů neefektivní. V současnosti bylo vyvinuto několik přístupů pro indexování XML dat. Většina přístupů se snaží efektivně vykonávat poměrně malou část zvoleného dotazovacího jazyka, navíc některé přístupy nelze použít pro indexování velkých objemů XML dat. Cílem

R&D category
ZV - Basic research
CEP classification - main branch
IN - Informatics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The main task of this project was a development of methods for searching XML data. Results were published at five international conferences: two conferences with proceedings in ACM, one in Springer, one in IEEE CS, one in IADIS digital library, and more

Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP09-GA0-GP-U/03:3
Data delivery date
Jan 22, 2015

Similar projects(10)