Formální reprezentace jazykových struktur
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
—
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
—
Číslo smlouvy
—
Alternativní jazyk
Název projektu anglicky
Formal representation of language structures
Anotace anglicky
Natural Language Processing ( NLP ) of the Czech language is one of the high priority tasks of Czech linguistics. It presupposes a specification of the formal representation of language structures to be built which will be used as a target representationfor sentence analysis ( of running texts, queries etc. ) as well as a source representation for next generation ( as a part of machine translation systems, abstract generation systems, question answering systems etc.). Such representation must be formally correct, nonredundant ( as much as possible and transparent from the interpretation point of view. They must reflect the structural properties of Czech and other Indo - European languages, and be based on empirical language studies. We assume that anunprecedented, large scale evaluation will take place during the project to ensure proper feedback. NLP is in the centre of interest today. It is therefore necessary to follow the developments in the NLP community at large. From the scientific point of
Vědní obory
Kategorie VaV
—
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
AF - Dokumentace, knihovnictví, práce s informacemi
CEP - další vedlejší obor
BD - Teorie informace
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10102 - Applied mathematics<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>50803 - Information science (social aspects)<br>50804 - Library science<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
V rámci projektu byl vytvořen tzv.Pražský závislostní korpus, obsahující 30 000 běžných českých vět označkovaných na morfologické a analytické rovině. Výsledky projektu jsou pro další počítačové zpracování češtiny velmi významné. Mají mezinárodní paramet
Termíny řešení
Zahájení řešení
1. 1. 1996
Ukončení řešení
1. 1. 1998
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP/1999/GA0/GA09GA/V/6:6
Datum dodání záznamu
—
Finance
Celkové uznané náklady
3 240 tis. Kč
Výše podpory ze státního rozpočtu
1 734 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč