All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Methods for rapid discourse annotation in selected corpora

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    SGA0202200004

  • Main participants

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Contest type

    VS - Public tender

  • Contract ID

    22-03269S

Alternative language

  • Project name in Czech

    Metody pro rychlou diskurzní anotaci ve vybraných korpusech

  • Annotation in Czech

    Projekt je zaměřen na výzkum a vývoj inovativních nákladově efektivních metod diskurzní anotace v různých typech textových korpusů dostupných v Prague Dependency Treebank - Consolidated 1.0 (PDT-C). Využijeme a dále rozvineme existující metody pro automatickou diskurzní předanotaci dat a v mezích daných velikostí tohoto projektu provedeme nejdůležitější ruční opravy takto automaticky předanotovaných dat, čímž vytvoříme jedinečný žánrově rozmanitý diskurzně anotovaný korpus v češtině. Projekt se bude zabývat explicitními diskurzními vztahy vyjádřenými tzv. primárními konektory. Výzkum bude věnován rovněž zpřístupnění teoretických i praktických výsledků mezinárodní vědecké komunitě, včetně transformace a zveřejnění dat v široce používaném formátu a taxonomii Penn Discourse Treebanku (PDTB). Výstupy přispějí jak k teoretickým znalostem o diskurzních vztazích v různých typech textů v češtině, nově především v mluvených a přeložených datech, tak ke strojovému zpracování přirozeného jazyka v souvislosti s diskurzními vztahy.

Scientific branches

  • R&D category

    ZV - Basic research

  • OECD FORD - main branch

    60203 - Linguistics

  • OECD FORD - secondary branch

  • OECD FORD - another secondary branch

  • CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    AI - Linguistics

Solution timeline

  • Realization period - beginning

    Jan 1, 2022

  • Realization period - end

    Dec 31, 2024

  • Project status

    K - Ending multi-year project

  • Latest support payment

    Mar 10, 2023

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP24-GA0-GA-R

  • Data delivery date

    Feb 19, 2024

Finance

  • Total approved costs

    2,992 thou. CZK

  • Public financial support

    2,992 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK