Shallow Discourse Parsing in Czech
Project goals
The project aims at a development of an automatic method of shallow discourse parsing in Czech. It will use several key resources, some of them already existing (most importantly the Prague Dependency Treebank, the Penn Discourse Treebank, the Prague Czech-English Dependency Treebank), some of them will be developed within the project, using cost-effective methods (electronic lexicon of discourse connectives, additional discourse-annotated data).
Keywords
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 23 (SGA0201900001)
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VS - Public tender
Contract ID
19-03490S
Alternative language
Project name in Czech
Automatická analýza diskurzních vztahů v češtině
Annotation in Czech
Projekt si klade za cíl vytvoření automatické metody pro anotaci diskurzních vztahů v češtině. Využije řady klíčových datových zdrojů, přičemž některé z nich již existují (především Pražský závislostní korpus, Penn Discourse Treebank, Prague Czech-English Dependency Treebank), některé budou vytvořeny v rámci projektu s použitím nákladově efektivních metod (elektronický slovník diskurzních konektorů, další diskurzně anotovaná data).
Scientific branches
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project team achieved the declared aims in all three interconnected lines of research, i.e.: 1) developing an electronic lexicon of Czech discourse connectives with rich linguistic annotation; 2) developing a shallow discourse parser for Czech, with the use of the lexicon; 3) further utilizing of additional discourse-annotated data.
Solution timeline
Realization period - beginning
Jan 1, 2019
Realization period - end
Dec 31, 2021
Project status
U - Finished project
Latest support payment
May 12, 2021
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP22-GA0-GA-U
Data delivery date
Jun 29, 2022
Finance
Total approved costs
2,405 thou. CZK
Public financial support
2,209 thou. CZK
Other public sources
196 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
2 405 CZK thou.
Public support
2 209 CZK thou.
91%
Provider
Czech Science Foundation
OECD FORD
Linguistics
Solution period
01. 01. 2019 - 31. 12. 2021