All
All

What are you looking for?

All
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Shallow Discourse Parsing in Czech

Project goals

The project aims at a development of an automatic method of shallow discourse parsing in Czech. It will use several key resources, some of them already existing (most importantly the Prague Dependency Treebank, the Penn Discourse Treebank, the Prague Czech-English Dependency Treebank), some of them will be developed within the project, using cost-effective methods (electronic lexicon of discourse connectives, additional discourse-annotated data).

Keywords

discourse parsingconnectives lexiconannotation projection

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    Standardní projekty 23 (SGA0201900001)

  • Main participants

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Contest type

    VS - Public tender

  • Contract ID

    19-03490S

Alternative language

  • Project name in Czech

    Automatická analýza diskurzních vztahů v češtině

  • Annotation in Czech

    Projekt si klade za cíl vytvoření automatické metody pro anotaci diskurzních vztahů v češtině. Využije řady klíčových datových zdrojů, přičemž některé z nich již existují (především Pražský závislostní korpus, Penn Discourse Treebank, Prague Czech-English Dependency Treebank), některé budou vytvořeny v rámci projektu s použitím nákladově efektivních metod (elektronický slovník diskurzních konektorů, další diskurzně anotovaná data).

Scientific branches

  • R&D category

    ZV - Basic research

  • OECD FORD - main branch

    60203 - Linguistics

  • OECD FORD - secondary branch

  • OECD FORD - another secondary branch

  • AI - Linguistics

Completed project evaluation

  • Provider evaluation

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Project results evaluation

    The project team achieved the declared aims in all three interconnected lines of research, i.e.: 1) developing an electronic lexicon of Czech discourse connectives with rich linguistic annotation; 2) developing a shallow discourse parser for Czech, with the use of the lexicon; 3) further utilizing of additional discourse-annotated data.

Solution timeline

  • Realization period - beginning

    Jan 1, 2019

  • Realization period - end

    Dec 31, 2021

  • Project status

    U - Finished project

  • Latest support payment

    May 12, 2021

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP22-GA0-GA-U

  • Data delivery date

    Jun 29, 2022

Finance

  • Total approved costs

    2,405 thou. CZK

  • Public financial support

    2,209 thou. CZK

  • Other public sources

    196 thou. CZK

  • Non public and foreign sources

    0 thou. CZK

Basic information

Recognised costs

2 405 CZK thou.

Public support

2 209 CZK thou.

91%


Provider

Czech Science Foundation

OECD FORD

Linguistics

Solution period

01. 01. 2019 - 31. 12. 2021