Inteligentní analýza obsahu a struktury WWW
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 2 (SGA02003GA-ST)
Hlavní účastníci
Vysoká škola ekonomická v Praze / Fakulta informatiky a statistiky
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
—
Alternativní jazyk
Název projektu anglicky
Intelligent analysis of WWW content and structure
Anotace anglicky
Intelligent analysis of the World-Wide Web content and structure is considered as major application area by both information retrieval and knowledge engineering research; the principal paradigms however differ. IR researchers view the web as an enormouscollection of text documents that can be represented as uniform vectors of features; the hugeness of this collection can be attacked by statistical techniques such as latent semantic indexing. KE researchers focus on logical inference and abstraction ofconceptual metadata from elementary terms and structures; the semantics is formalised by ontologies. The current project attempts to integrate both views. The main tasks addressed are: mathematical formalisation of the metadata extraction task, design ofanintegrated collection of web ontologies, development of an agent architecture for web analysis (relying on the redundancy and complementarity of information expressed by different types of data), design of a structured XML-based representation of web
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
JD - Využití počítačů, robotika a její aplikace
CEP - vedlejší obor
BB - Aplikovaná statistika, operační výzkum
CEP - další vedlejší obor
AF - Dokumentace, knihovnictví, práce s informacemi
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10103 - Statistics and probability<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>20204 - Robotics and automatic control<br>20205 - Automation and control systems<br>50803 - Information science (social aspects)<br>50804 - Library science
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Cílem projektu bylo vyvinout a integrovat soubor různorodých metod aplikovatelných na analýzu obsahu a struktury WWW. Vedle činností bezprostředně směřujících k této aplikaci se projektový tým věnoval i vývoji metod s obecnějším využitím, jako je efektiv
Termíny řešení
Zahájení řešení
1. 1. 2003
Ukončení řešení
1. 1. 2005
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP06-GA0-GA-U/07:6
Datum dodání záznamu
15. 1. 2009
Finance
Celkové uznané náklady
1 500 tis. Kč
Výše podpory ze státního rozpočtu
834 tis. Kč
Ostatní veřejné zdroje financování
666 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč