All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Grammar-based treebank of Czech

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    Standardní projekty 17 (SGA0201300005)

  • Main participants

    Univerzita Karlova / Filozofická fakulta

  • Contest type

    VS - Public tender

  • Contract ID

    13-27184S

Alternative language

  • Project name in Czech

    Treebank češtiny na základě gramatiky

  • Annotation in Czech

    Tento matematicko-lingvistický projekt se zaměřuje na vytvoření formální gramatiky zachycující povrchovou syntax češtiny a na podstatné zkvalitnění plně automatické syntaktické analýzy češtiny. Prostřednictvím řady vylepšených softwarových nástrojů (morfologický analyzátor, automatické programy pro morfologickou anotaci - taggery, syntaktické analyzátory) se vytvoří syntaktická struktura vstupní české věty. Tuto strukturu bude možné různým způsobem zobrazovat (například v podobě závislostní či složkové struktury, v různé míře podspecifikace apod.) a exportovat do různých formátů, a to i podle požadavků různých syntaktických teorií. Návrh gramatiky i softwarové nástroje se budou opírat o velké textové zdroje - korpusy současné češtiny shromážděné v Českém národním korpusu. Softwarové nástroje v souladu s gramatikou také tyto dosud jen morfologicky označkované korpusy syntakticky oanotují a vytvoří tak rozsáhlé syntakticky anotované korpusy - treebanky. Tento projekt je pokračováním projektu Syntaktická analýza českých korpusů.

Scientific branches

  • R&D category

    ZV - Basic research

  • CEP classification - main branch

    AI - Linguistics

  • CEP - secondary branch

  • CEP - another secondary branch

  • OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Completed project evaluation

  • Provider evaluation

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Project results evaluation

    The project, focused on a formal grammar describing a surface syntactic structure of Czech, followed the research plan. Its goals were met, the results were published (one book, several articles, papers in conference proceedings); in addition, a syntactically annotated treebank has been built, however, it is not publically available yet. The research team conformed to the grant agency regulations.

Solution timeline

  • Realization period - beginning

    Feb 1, 2013

  • Realization period - end

    Nov 24, 2016

  • Project status

    U - Finished project

  • Latest support payment

    Apr 1, 2016

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP17-GA0-GA-U/03:1

  • Data delivery date

    Jun 28, 2017

Finance

  • Total approved costs

    4,883 thou. CZK

  • Public financial support

    4,883 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK