Resources and Tools for Information Systems
Public support
Provider
Academy of Sciences of the Czech Republic
Programme
Information society (National programme of research)
Call for proposals
Informační společnost 1 (SAV02004-IS)
Main participants
—
Contest type
VS - Public tender
Contract ID
1ET101120413
Alternative language
Project name in Czech
Data a nástroje pro informační systémy
Annotation in Czech
Projekt aplikovaného výzkumu "Datové zdroje a nástroje pro informační systémy" řeší problematiku cíleného vyhledávání ve fulltextových systémech (psaných či mluvených) v češtině (kde použití standardních technologických postupů vyvinutých pro jazyky jiného typu poskytuje výrazně horší výsledky a komfort pro uživatele). Jádrem projektu je posílení současných metod automatické morfologické (tvaroslovné) analýzy češtiny směrem k vyšší přesnosti identifikace lexikálních jednotek a částečně i jejich významů.Projekt využije dnešní špičkové světové technologie, které jsou založeny na statistických metodách a strojovém učení na základě lingvisticky anotovaných dat. Pro tyto účely budou v projektu připravena anotovaná data (za výrazně nižších nákladů než v minulosti, pomocí automatické konverze ze starších zdrojů), sloučena s existujícícmi daty a na jejich základě vytvořeny nástroje pro morfologickou analýzu bežného textu s takovými parametry, které budou umožňovat nasazení v praxi.
Scientific branches
R&D category
NV - Nonindustrial research (Applied research excluded Industrial research)
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
JD - Use of computers, robotics and its application
CEP - another secondary branch
BD - Information theory
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10102 - Applied mathematics<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>20204 - Robotics and automatic control<br>20205 - Automation and control systems<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
We built an extensive data base and a pool of natural language tools: The Czech Academic Corpus, The Reference Dictionary of Czech, The Kott´s dictionary and The Jungmann´s dictionary; tools for morphological and syntactic processing of Czech.
Solution timeline
Realization period - beginning
Jul 1, 2004
Realization period - end
Dec 31, 2008
Project status
U - Finished project
Latest support payment
Feb 21, 2008
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP09-AV0-1E-U/02:3
Data delivery date
May 4, 2009
Finance
Total approved costs
19,660 thou. CZK
Public financial support
17,760 thou. CZK
Other public sources
1,900 thou. CZK
Non public and foreign sources
0 thou. CZK