K počítačové analýze struktury textu

Název projektu anglicky
Towards a computational analysis of text structure
Anotace anglicky
The project aims to create a computational model of the text structure in Czech and in English that will serve for the purposes of natural language processing (NLP). The present project is based on the data from two annotated corpora: Prague Dependency Treebank (Charles University in Prague, Czech Republic) and Penn Discourse Treebank (University of Pennsylvania, USA). In the first part of the project, the final part of the Czech annotation will be completed and the multilingual data will be used for testing and subsequent improvement of annotation systems. The results of the analysis will be available e.g. for automatic information retrieval, text summarization or computer translation.

Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
IN - Informatika
CEP - další vedlejší obor
BD - Teorie informace
OECD FORD - odpovídající obory (dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10102 - Applied mathematics 10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8) 60201 - General language studies 60202 - Specific languages 60203 - Linguistics

Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Byl vytvořen ucelený návrh anotace textových vztahů pro anotaci češtiny. Na jeho základě byla zpracována data Pražského závislostního korpusu a vydána s rozsáhlou dokumentací na CD jako Pražský diskurzní korpus (PDiT). Práce proběhly za spolupráce s par?

Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP13-MSM-ME-U/01:1
Datum dodání záznamu
28. 6. 2013

Podobné projekty(10)