Syntaktická analýza souvětí pro počítačové zpracování češtiny
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 11 (SGA02008GA-ST)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
405/08/0681
Alternativní jazyk
Název projektu anglicky
Syntactic Analysis of Czech Complex Sentences for Natural Language Processing
Anotace anglicky
The main goal of the project is to elaborate and test an automatic method for estimating the structure of Czech complex sentences with regard to a mutual relationship between its clauses on the basis of linguistic evidence.The following tasks are carriedin the proposed project:1. Development of a formal background for the theory of segments and clauses;2. Collecting linguistic evidence and classification of the data;3. Development and implementation of an automatic procedure for segmentation of complexsentences;4. Investigation of a mathematical background of the theory;5. Design of a system of tags for segments and rules for connecting individual segments into clauses;6. Implementation of an automatic procedure connecting individual segments into clauses;7. Re-annotation of a part of data in the Prague Dependency Treebank in order to create testing data;8. Evaluation of the implemented procedures.The segmentation and the subsequent creation of a clause structure of a complex sentence helps to
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
IN - Informatika
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Cíle grantového projektu ? vývoj a testování automatických metod pro stanovení struktury českých souvětí, tedy odhad vzájemných syntaktických vztahů mezi klauzemi v souvětí na základě lingvistické evidence ? byly ve všech plánovaných aspektech naplněny.?
Termíny řešení
Zahájení řešení
1. 4. 2008
Ukončení řešení
31. 12. 2010
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
16. 4. 2010
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP11-GA0-GA-U/03:3
Datum dodání záznamu
9. 2. 2015
Finance
Celkové uznané náklady
1 995 tis. Kč
Výše podpory ze státního rozpočtu
1 995 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč