Vše
Vše

Co hledáte?

Vše
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Metody pro efektivní vyhledávání v rozsáhlých kolekcích slabě strukturovaných dat

Cíle projektu

Značkovací jazyk XML (Extensible Markup Language) přinesl formalizovaný nástroj pro popis slabě strukturovaných dat. XML může sloužit jako prostředek pro výměnu dat, prezentaci dokumentů v prostředí Internetu apod. Z pohledu databázové technologie můžemeXML chápat jako jazyk pro modelování dat. Implementace systémů vhodných pro efektivní uložení a dotazování XML dokumentů (tzv. nativní XML databáze) vyžaduje vývoj nových technik. XML dokument může být modelován jako graf a XML dotazovací jazyky umožňujíprocházet tímto grafem zadáním výrazu cesty. Jelikož cesty je možné specifikovat regulárním výrazem, popř. mohou být použity další komplikovanější dotazy, je použití stávajících databázových přístupů pro vykonávání takových dotazů neefektivní. V současnosti bylo vyvinuto několik přístupů pro indexování XML dat. Většina přístupů se snaží efektivně vykonávat poměrně malou část zvoleného dotazovacího jazyka, navíc některé přístupy nelze použít pro indexování velkých objemů XML dat. Cílem

Klíčová slova

searchingindexingsemi-structured datadata structure

Veřejná podpora

  • Poskytovatel

    Grantová agentura České republiky

  • Program

    Postdoktorandské granty

  • Veřejná soutěž

    Postdoktorandské granty 6 (SGA02006GA1PD)

  • Hlavní účastníci

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    201/06/P113

Alternativní jazyk

  • Název projektu anglicky

    Methods for efficient searching in large collections of semi-structured data

  • Anotace anglicky

    The mark-up language XML (Extensible Mark-up Language) has become a standard for description of the semi-structured data. The XML is a tool for exchange of data, presentation of documents on the Web and so on. From database point of view XML is recentlyunderstood as a new approach to data modelling. Implementation of a system enabling us to store and query XML documents efficiently (so called native XML databases) requires a development of new techniques. An XML document is usually modelled as a graphthe nodes of which correspond to XML elements and attributes. To obtain specified data from an XML database a number of special query languages have been developed. A common feature of these languages is a possibility to formulate paths in the XML graph.Conventional approaches through the conventional database languages SQL or OQL fail or they are not too efficient. Recently there are several approaches to indexing XML or, more general, semi-structured data. The most of the approaches solve only small

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • CEP - hlavní obor

    IN - Informatika

  • CEP - vedlejší obor

  • CEP - další vedlejší obor

  • OECD FORD - odpovídající obory
    (dle převodníku)

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Zhodnocení výsledků projektu

    Hlavním úkolem projektu byl vývoj nových metod pro vyhledávání v XML datech. Výsledky projektu byly publikovány na pěti mezinárodních konferencích: na dvou konferencích se sborníkem v ACM, jedné ve Springer, jedné v IEEE Computer Society, jedné v IADIS d

Termíny řešení

  • Zahájení řešení

    1. 1. 2006

  • Ukončení řešení

    31. 12. 2008

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    25. 4. 2008

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP09-GA0-GP-U/03:3

  • Datum dodání záznamu

    22. 1. 2015

Finance

  • Celkové uznané náklady

    693 tis. Kč

  • Výše podpory ze státního rozpočtu

    693 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč

Základní informace

Uznané náklady

693 tis. Kč

Statní podpora

693 tis. Kč

100%


Poskytovatel

Grantová agentura České republiky

CEP

IN - Informatika

Doba řešení

01. 01. 2006 - 31. 12. 2008