All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”
LH14011

Multilingual Corpus Annotation as a Support for Language Technologies

Public support

  • Provider

    Ministry of Education, Youth and Sports

  • Programme

    KONTAKT II

  • Call for proposals

    KONTAKT II 4 (SMSM2014LH4)

  • Main participants

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Contest type

    VS - Public tender

  • Contract ID

    MSMT-9919/2014-1

Alternative language

  • Project name in Czech

    Vícejazyčná korpusová anotace jako podpora jazykových technologií

  • Annotation in Czech

    Cílem projektu je provést lingvistickou analýzu nadvětných jazykových celků (textu) a na jejím základě vytvořit, porovnat a uplatnit anotační schémata pro zachycení různých textových jevů v českých a anglických datech (počítačových korpusech). Předevšímpůjde o anotaci koreference a vztahů asociační anafory, alternativních lexikálních prostředků pro vyjádření textových vztahů, o možnosti zachycení žánrové specifikace korpusových textů a dále o sondy do oblasti implicitních, tedy formálně nevyjádřených textových vztahů. Bude provedena automatická identifikace a analýza částí textu se slabou koherencí a proveden experiment s partnerským pracovištěm zabývající se mírou koherence textů.

Scientific branches

  • R&D category

    ZV - Basic research

  • CEP classification - main branch

    AI - Linguistics

  • CEP - secondary branch

    IN - Informatics

  • CEP - another secondary branch

  • OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Completed project evaluation

  • Provider evaluation

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Project results evaluation

    In 2015, following targets have been achieved: (1) the data with the annotation of alternative lexicalization of discourse connectives were published (e.g. the reason was; The Prague Discourse Treebank 2.0). A reserach on implicit, coreference and bridging relations was carried out. The results were presented at bilateral Czech-American workshop and published in scientific journals.

Solution timeline

  • Realization period - beginning

    Apr 1, 2014

  • Realization period - end

    Dec 31, 2016

  • Project status

    U - Finished project

  • Latest support payment

    Feb 18, 2016

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP17-MSM-LH-U/01:1

  • Data delivery date

    Jun 23, 2017

Finance

  • Total approved costs

    1,583 thou. CZK

  • Public financial support

    1,583 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK