K počítačové analýze struktury textu
Veřejná podpora
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Program
KONTAKT
Veřejná soutěž
KONTAKT 8 (SMSM2010ME5)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
2062/2011-320
Alternativní jazyk
Název projektu anglicky
Towards a computational analysis of text structure
Anotace anglicky
The project aims to create a computational model of the text structure in Czech and in English that will serve for the purposes of natural language processing (NLP). The present project is based on the data from two annotated corpora: Prague Dependency Treebank (Charles University in Prague, Czech Republic) and Penn Discourse Treebank (University of Pennsylvania, USA). In the first part of the project, the final part of the Czech annotation will be completed and the multilingual data will be used for testing and subsequent improvement of annotation systems. The results of the analysis will be available e.g. for automatic information retrieval, text summarization or computer translation.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
IN - Informatika
CEP - další vedlejší obor
BD - Teorie informace
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10102 - Applied mathematics<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Byl vytvořen ucelený návrh anotace textových vztahů pro anotaci češtiny. Na jeho základě byla zpracována data Pražského závislostního korpusu a vydána s rozsáhlou dokumentací na CD jako Pražský diskurzní korpus (PDiT). Práce proběhly za spolupráce s par?
Termíny řešení
Zahájení řešení
1. 5. 2010
Ukončení řešení
31. 12. 2012
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
16. 2. 2012
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP13-MSM-ME-U/01:1
Datum dodání záznamu
28. 6. 2013
Finance
Celkové uznané náklady
1 700 tis. Kč
Výše podpory ze státního rozpočtu
1 700 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč