Vyhledávání a indexování XML dokumentů
Cíle projektu
Vyhledávání a indexování XML dokumentů: Jazyk XML dnes patří k nejdiskutovanějším tématům průmyslu IS/IT. Primárním cílem XML je poskytnout značkování komponent textu a použití takových dat pro výměnu mezi informačními zdroji. Na druhé straně, XML datajsou aplikacemi generována a mohou být také aplikacemi používána. Ukazuje se, že je žádoucí taková data zpracovávat databázovým způsobem. Cílem projektu je zkoumat databázový pohled na XML data. Řečeno pojmy z databází, je možné chápat XML jako jazyk promodelování dat. Pro výběr XML dat bylo navrženo několik dotazovacích jazyků. Aby je bylo možné implementovat efektivně, je nutné navrhnout pro XML data vhodnou indexovou strukturu. V projektu plánujeme studovat multidimensionální datové struktury jakoprostředek pro indexování XML dat, a vyvinout experimentální prostředí pro testování implementací takových datových struktur. To znamená vybrat základní typy dotazů v dostupných dotazovacích jazycích a implementovat je pomocí navržených indexových
Klíčová slova
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 2 (SGA02003GA-ST)
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
—
Alternativní jazyk
Název projektu anglicky
XML documents searching and indexing
Anotace anglicky
XML Documents Searching and Indexing: The XML language belongs today to the most discussed topics in IS/IT industry. The primary goal of the XML was to provide text marking components and use such data for exchange between information sources. On theother hand, XML data are generated by applications and it can be consumed by applications. A database processing of XML data is required. The goal of the project is to explore a database view of XML data. Using the terminology usual in databases, it ispossible to view XML as a language for data modelling. To retrieve XML data from XML databases, several query languages have been proposed. For their implementation, an efficient access to XML data is necessary and, consequently, appropriate indexstructures for XML should be designed. In the project, we plan to study multidimensional data structures for XML data indexing and develop an experimental environment for testing implementation of such data structures. On base of analysis of the
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
JC - Počítačový hardware a software
CEP - vedlejší obor
BC - Teorie a systémy řízení
CEP - další vedlejší obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD - odpovídající obory
(dle převodníku)10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
20204 - Robotics and automatic control
20205 - Automation and control systems
20206 - Computer hardware and architecture
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Vývoj metod pro implementaci vyhledávání v XML dokumentech vycházel z metod vyhledávání v textech nebo v kolekcích textů. Část prací byla proto věnována efektivní implementaci vektorového modelu - dnes základní metodě vyhledávání informací. Výsledkem jso
Termíny řešení
Zahájení řešení
1. 1. 2003
Ukončení řešení
1. 1. 2005
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP06-GA0-GA-U/07:6
Datum dodání záznamu
15. 1. 2009
Finance
Celkové uznané náklady
1 120 tis. Kč
Výše podpory ze státního rozpočtu
1 120 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
1 120 tis. Kč
Statní podpora
1 120 tis. Kč
100%
Poskytovatel
Grantová agentura České republiky
CEP
JC - Počítačový hardware a software
Doba řešení
01. 01. 2003 - 01. 01. 2005