Intelligent retrieval in document information systems
Project goals
The topic of intelligent retrieval from large texts belongs to the most important problems of accessing information sources placed both in Internet and in local information centers. Current tools based mainly on the Boolean model of retrieval are not ablto reach the evaluating a query with the high precision and simultaneously with the high recall. The aim of the proposed research is to contribute to the processing uncertain information in document information systems (DIS) with stress to combination ofalgebraic and logic approach. The main theoretic goal is to work up the Dempster-Shafer theory of evidence, i.e. the work with interval weights for query, for the query evaluation in DIS. It is supposed that this evaluation will be based on principal component approach. Because an algorithmic basis is not effective enough here, we will try to use neural network approach, which seems to be more effective for this purpose. To be able to compare the theoretical results in practice it is supposed that
Keywords
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 1 (SGA02002GA-ST)
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VS - Public tender
Contract ID
—
Alternative language
Project name in Czech
Inteligentní vyhledávání v dokumentografických informačních systémech
Annotation in Czech
Problematika inteligentního vyhledávání v rozsáhlých textech patří k nejzávažnějším problémům přístupu k informačním zdrojům umístěným jak na Internetu, tak v lokálních informačních centrech. Dosavadní nástroje založené hlavně na Boolském vyhledávání nejsou schopné dosáhnout vyhodnocení dotazu s vysokou přesností a současně vysokou úplností. Cílem výzkumu je přispět k rozvoji zpracování nejisté informace v dokumentografických informačních systémech (DIS) se zaměřením na algebraicko-logický přístup. Teoretickým cílem výzkumu je rozpracování Dempster Shaferovy teorie evidence, tedy práce s intervalovými vahami, pro vyhodnocení dotazu v DIS. Pro vyhodnocení váženého dotazu je nezbytné provést valuaci dokumentů. Tato valuace bude prováděna s využitím metody hlavních komponent, která bude realizována pomocí přístupu založeném na paradigmatu neuronových sítí. Praktickým cílem bude realizace DIS, který bude sloužit k testování dosažených teoretických výsledků. Tato práce by měla sloužit jako úvod k
Scientific branches
R&D category
—
CEP classification - main branch
JC - Computer hardware and software
CEP - secondary branch
BD - Information theory
CEP - another secondary branch
—
10102 - Applied mathematics
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
20206 - Computer hardware and architecture
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
V rámci projektu byly získány zajímavé výsledky, které byly velmi intenzivně prezentovány na mezinárodních konferencích. Publikační činnost do časopisů by měla být lepší. Závěrečná karta vystihuje získané výsledky. Publikační činnost do zborníků byla úsp
Solution timeline
Realization period - beginning
Jan 1, 2000
Realization period - end
Jan 1, 2002
Project status
U - Finished project
Latest support payment
—
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP/2003/GA0/GA03GA/U/N/9:7
Data delivery date
May 19, 2008
Finance
Total approved costs
760 thou. CZK
Public financial support
629 thou. CZK
Other public sources
195 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
760 CZK thou.
Public support
629 CZK thou.
82%
Provider
Czech Science Foundation
CEP
JC - Computer hardware and software
Solution period
01. 01. 2000 - 01. 01. 2002