XML documents searching and indexing
Project goals
XML Documents Searching and Indexing: The XML language belongs today to the most discussed topics in IS/IT industry. The primary goal of the XML was to provide text marking components and use such data for exchange between information sources. On theother hand, XML data are generated by applications and it can be consumed by applications. A database processing of XML data is required. The goal of the project is to explore a database view of XML data. Using the terminology usual in databases, it ispossible to view XML as a language for data modelling. To retrieve XML data from XML databases, several query languages have been proposed. For their implementation, an efficient access to XML data is necessary and, consequently, appropriate indexstructures for XML should be designed. In the project, we plan to study multidimensional data structures for XML data indexing and develop an experimental environment for testing implementation of such data structures. On base of analysis of the
Keywords
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 2 (SGA02003GA-ST)
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VS - Public tender
Contract ID
—
Alternative language
Project name in Czech
Vyhledávání a indexování XML dokumentů
Annotation in Czech
Vyhledávání a indexování XML dokumentů: Jazyk XML dnes patří k nejdiskutovanějším tématům průmyslu IS/IT. Primárním cílem XML je poskytnout značkování komponent textu a použití takových dat pro výměnu mezi informačními zdroji. Na druhé straně, XML datajsou aplikacemi generována a mohou být také aplikacemi používána. Ukazuje se, že je žádoucí taková data zpracovávat databázovým způsobem. Cílem projektu je zkoumat databázový pohled na XML data. Řečeno pojmy z databází, je možné chápat XML jako jazyk promodelování dat. Pro výběr XML dat bylo navrženo několik dotazovacích jazyků. Aby je bylo možné implementovat efektivně, je nutné navrhnout pro XML data vhodnou indexovou strukturu. V projektu plánujeme studovat multidimensionální datové struktury jakoprostředek pro indexování XML dat, a vyvinout experimentální prostředí pro testování implementací takových datových struktur. To znamená vybrat základní typy dotazů v dostupných dotazovacích jazycích a implementovat je pomocí navržených indexových
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
JC - Computer hardware and software
CEP - secondary branch
BC - Theory and management systems
CEP - another secondary branch
JD - Use of computers, robotics and its application
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
20204 - Robotics and automatic control
20205 - Automation and control systems
20206 - Computer hardware and architecture
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
A development of methods for implementation of retrieval from XML documents has been based on methods of information retrieval from texts or from text collections. A part of activities has been devoted to an effective implementation of the vector space m
Solution timeline
Realization period - beginning
Jan 1, 2003
Realization period - end
Jan 1, 2005
Project status
U - Finished project
Latest support payment
—
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP06-GA0-GA-U/07:6
Data delivery date
Jan 15, 2009
Finance
Total approved costs
1,120 thou. CZK
Public financial support
1,120 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Recognised costs
1 120 CZK thou.
Public support
1 120 CZK thou.
0%
Provider
Czech Science Foundation
CEP
JC - Computer hardware and software
Solution period
01. 01. 2003 - 01. 01. 2005