Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Data a nástroje pro informační systémy

Veřejná podpora

  • Poskytovatel

    Akademie věd České republiky

  • Program

    Informační společnost (Národní program výzkumu)

  • Veřejná soutěž

    Informační společnost 1 (SAV02004-IS)

  • Hlavní účastníci

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    1ET101120413

Alternativní jazyk

  • Název projektu anglicky

    Resources and Tools for Information Systems

  • Anotace anglicky

    The project "Resources and Tools for Information Systems" focuses on fulltext information systems (containing both written and spoken materials) in Czech (where standard methods fail due to the different type of languages they have been developed for). The project aims to strenghten and improve current methods for morphological analysis of Czech, in order to attain higher precison in identifying lexical units and in some cases also their meaning. The project will use state-of-the-art statistical technology and machine learning based on linguistically annotated data. Within the project, such data will be prepared (at a fraction of the usual cost) by conversion of older resources, and tools will be created (based on the resulting larger corpus) that would have parameters needed for a successful application in end-user information systems.

Vědní obory

  • Kategorie VaV

    NV - Neprůmyslový výzkum (aplikovaný výzkum s výjimkou průmyslového)

  • CEP - hlavní obor

    AI - Jazykověda

  • CEP - vedlejší obor

    JD - Využití počítačů, robotika a její aplikace

  • CEP - další vedlejší obor

    BD - Teorie informace

  • OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)

    10102 - Applied mathematics<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>20204 - Robotics and automatic control<br>20205 - Automation and control systems<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Zhodnocení výsledků projektu

    Vytvoření rozsáhlé základny jazykových dat a nástrojů: Český akademický korpus, Příruční slovník jazyka českého, Kottův slovník a Jungmannův slovník; nástroje pro morfologické a syntaktické zpracování českých textů.

Termíny řešení

  • Zahájení řešení

    1. 7. 2004

  • Ukončení řešení

    31. 12. 2008

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    21. 2. 2008

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP09-AV0-1E-U/02:3

  • Datum dodání záznamu

    4. 5. 2009

Finance

  • Celkové uznané náklady

    19 660 tis. Kč

  • Výše podpory ze státního rozpočtu

    17 760 tis. Kč

  • Ostatní veřejné zdroje financování

    1 900 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč