All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Computational Linguistics: Explicit description of language and annotated data focused on Czech

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    Standardní projekty 13 (SGA02010GA-ST)

  • Main participants

  • Contest type

    VS - Public tender

  • Contract ID

    P406-10-0875

Alternative language

  • Project name in Czech

    Komputační lingvistika: Explicitní popis jazyka a anotovaná data se zřetelem na češtinu

  • Annotation in Czech

    V Centru komputační lingvistiky při MFF UK (2000-2005, 2005-2009) byl vytvořen bohatě syntakticky anotovaný anotovaný korpus češtiny (PDT 2.0), který bude sloužit v navrhovaném projektu jako zdroj teoretického lingvistického výzkumu směřujícího k aplikacím v oblasti automatického zpracování jazyka.Výzkum bude probíhat v těchto směrech: (a) hlubší zkoumání vztahu formy a funkce, (b) přechod od syntaxe věty k mezivětným vztahům, (c) zkoumání vztahů mezi hloubkovou syntaxí a kognitivním obsahem a (d) výzkum specifických jevů mluveného jazyka na všech úrovních popisu. Prioritou budou jevy, které dosud v explicitním popisu zacyceny nebyly nebo jejichž zachycení nedává uspokojivé výsledky. Výzkum je zaměřen především na češtinu a angličtinu. Kromě teoretických publikací bude výsledkem projektu obohacené anotační schéma pro zpracovávané jazyky a na základě tohoto schématu rozšířený Pražský závislostní korpus (pro češtinu, angličtinu a mluvený jazyk). Rozšířené korpusy budou sloužit jak pro lingvistický výzkum, tak pro zlepšení metod užívaných pro automatickou analýzu a syntézu jazyka.

Scientific branches

  • R&D category

    ZV - Basic research

  • CEP classification - main branch

    AI - Linguistics

  • CEP - secondary branch

  • CEP - another secondary branch

  • OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Completed project evaluation

  • Provider evaluation

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Project results evaluation

    The project has achieved a high international standard. Its results are well presented. It contributes to theoretical knowledge of language and this can be easily applied in professional practice. In addition to publications, an output of the project isannotated corpuses of Czech. Regarding publications, however, most of them represent brief articles in proceedings.

Solution timeline

  • Realization period - beginning

    Jan 1, 2010

  • Realization period - end

    Dec 31, 2013

  • Project status

    U - Finished project

  • Latest support payment

    Jun 12, 2013

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP14-GA0-GA-U/01:1

  • Data delivery date

    Jul 1, 2014

Finance

  • Total approved costs

    15,858 thou. CZK

  • Public financial support

    15,858 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK