Data a nástroje pro informační systémy
Veřejná podpora
Poskytovatel
Akademie věd České republiky
Program
Informační společnost (Národní program výzkumu)
Veřejná soutěž
Informační společnost 1 (SAV02004-IS)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
1ET101120413
Alternativní jazyk
Název projektu anglicky
Resources and Tools for Information Systems
Anotace anglicky
The project "Resources and Tools for Information Systems" focuses on fulltext information systems (containing both written and spoken materials) in Czech (where standard methods fail due to the different type of languages they have been developed for). The project aims to strenghten and improve current methods for morphological analysis of Czech, in order to attain higher precison in identifying lexical units and in some cases also their meaning. The project will use state-of-the-art statistical technology and machine learning based on linguistically annotated data. Within the project, such data will be prepared (at a fraction of the usual cost) by conversion of older resources, and tools will be created (based on the resulting larger corpus) that would have parameters needed for a successful application in end-user information systems.
Vědní obory
Kategorie VaV
NV - Neprůmyslový výzkum (aplikovaný výzkum s výjimkou průmyslového)
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
JD - Využití počítačů, robotika a její aplikace
CEP - další vedlejší obor
BD - Teorie informace
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10102 - Applied mathematics<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>20204 - Robotics and automatic control<br>20205 - Automation and control systems<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Vytvoření rozsáhlé základny jazykových dat a nástrojů: Český akademický korpus, Příruční slovník jazyka českého, Kottův slovník a Jungmannův slovník; nástroje pro morfologické a syntaktické zpracování českých textů.
Termíny řešení
Zahájení řešení
1. 7. 2004
Ukončení řešení
31. 12. 2008
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
21. 2. 2008
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP09-AV0-1E-U/02:3
Datum dodání záznamu
4. 5. 2009
Finance
Celkové uznané náklady
19 660 tis. Kč
Výše podpory ze státního rozpočtu
17 760 tis. Kč
Ostatní veřejné zdroje financování
1 900 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč