All
All

What are you looking for?

All
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

XML documents searching and indexing

Project goals

XML Documents Searching and Indexing: The XML language belongs today to the most discussed topics in IS/IT industry. The primary goal of the XML was to provide text marking components and use such data for exchange between information sources. On theother hand, XML data are generated by applications and it can be consumed by applications. A database processing of XML data is required. The goal of the project is to explore a database view of XML data. Using the terminology usual in databases, it ispossible to view XML as a language for data modelling. To retrieve XML data from XML databases, several query languages have been proposed. For their implementation, an efficient access to XML data is necessary and, consequently, appropriate indexstructures for XML should be designed. In the project, we plan to study multidimensional data structures for XML data indexing and develop an experimental environment for testing implementation of such data structures. On base of analysis of the

Keywords

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    Standardní projekty 2 (SGA02003GA-ST)

  • Main participants

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Contest type

    VS - Public tender

  • Contract ID

Alternative language

  • Project name in Czech

    Vyhledávání a indexování XML dokumentů

  • Annotation in Czech

    Vyhledávání a indexování XML dokumentů: Jazyk XML dnes patří k nejdiskutovanějším tématům průmyslu IS/IT. Primárním cílem XML je poskytnout značkování komponent textu a použití takových dat pro výměnu mezi informačními zdroji. Na druhé straně, XML datajsou aplikacemi generována a mohou být také aplikacemi používána. Ukazuje se, že je žádoucí taková data zpracovávat databázovým způsobem. Cílem projektu je zkoumat databázový pohled na XML data. Řečeno pojmy z databází, je možné chápat XML jako jazyk promodelování dat. Pro výběr XML dat bylo navrženo několik dotazovacích jazyků. Aby je bylo možné implementovat efektivně, je nutné navrhnout pro XML data vhodnou indexovou strukturu. V projektu plánujeme studovat multidimensionální datové struktury jakoprostředek pro indexování XML dat, a vyvinout experimentální prostředí pro testování implementací takových datových struktur. To znamená vybrat základní typy dotazů v dostupných dotazovacích jazycích a implementovat je pomocí navržených indexových

Scientific branches

  • R&D category

    ZV - Basic research

  • CEP classification - main branch

    JC - Computer hardware and software

  • CEP - secondary branch

    BC - Theory and management systems

  • CEP - another secondary branch

    JD - Use of computers, robotics and its application

  • 10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
    20204 - Robotics and automatic control
    20205 - Automation and control systems
    20206 - Computer hardware and architecture

Completed project evaluation

  • Provider evaluation

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Project results evaluation

    A development of methods for implementation of retrieval from XML documents has been based on methods of information retrieval from texts or from text collections. A part of activities has been devoted to an effective implementation of the vector space m

Solution timeline

  • Realization period - beginning

    Jan 1, 2003

  • Realization period - end

    Jan 1, 2005

  • Project status

    U - Finished project

  • Latest support payment

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP06-GA0-GA-U/07:6

  • Data delivery date

    Jan 15, 2009

Finance

  • Total approved costs

    1,120 thou. CZK

  • Public financial support

    1,120 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK

Recognised costs

1 120 CZK thou.

Public support

1 120 CZK thou.

0%


Provider

Czech Science Foundation

CEP

JC - Computer hardware and software

Solution period

01. 01. 2003 - 01. 01. 2005