All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Czech National Corpus

Public support

  • Provider

    Ministry of Education, Youth and Sports

  • Programme

  • Call for proposals

  • Main participants

    Univerzita Karlova / Filozofická fakulta

  • Contest type

    VL - Approved by the Government

  • Contract ID

    MSMT-1000/2016

Alternative language

  • Project name in Czech

    Český národní korpus

  • Annotation in Czech

    CNC kontinuálně mapuje český jazyk prostřednictvím budování a zpřístupňování rozsáhlých jazykových korpusů. Jazyková data shromažďovaná CNC pokrývají široké spektrum žánrů a forem (od současné psané češtiny, přes češtinu mluvenou až po starší češtinu). Pro srovnávací výzkum je sestavován také paralelní korpus InterCorp zahrnující texty společně s jejich překlady mezi češtinou a více než 30 světovými jazyky. CNC představuje unikátní zdroj autentických informací o jazyce jak pro základní a aplikovaný jazykovědný výzkum, tak pro další společenskovědní a humanitní obory. Jazykové zdroje CNC jsou široce využívány zejména pro svou kontinuální povahu, pestrost a vyváženost složení, spolehlivá metadata a vysokou kvalitu zpracování pomocí nejnovějších nástrojů. CNC poskytuje uživatelský přístup k rozsáhlým datům na základě specializovaného webového rozhraní a uživatelskou podporu koncentrovanou do výzkumného portálu www.korpus.cz, včetně on-line poradny, manuálu a báze znalostí z korpusové lingvistiky ve formě wiki. Poskytuje také datové balíčky vytvořené na základě specifických požadavků uživatelů. CNC je v současnosti jediným specializovaným pracovištěm v ČR, které se systematicky soustředí na rozvíjení metodologie korpusové lingvistiky.

Scientific branches

  • R&D category

    IF - RDI infrastructure

  • CEP classification - main branch

    AI - Linguistics

  • CEP - secondary branch

  • CEP - another secondary branch

  • OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Completed project evaluation

  • Provider evaluation

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Project results evaluation

    The focus of the project was to continually map the Czech language by creating and providing access to extensive databases of authentic texts (language corpora), which are used primarily in language-oriented empirical research in the humanities and social sciences. Overall, the project can be considered a very successful one, its progress having taken place in accordance with the proposed plan (with only several minor exceptions). The plan was adhered to also with regard to the extent and the goals of the project, in fact some of the goals were completed beyond the scope of what was stated in the plan

Solution timeline

  • Realization period - beginning

    Jan 1, 2016

  • Realization period - end

    Dec 31, 2019

  • Project status

    U - Finished project

  • Latest support payment

    Feb 15, 2019

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP20-MSM-LM-U/03:1

  • Data delivery date

    Jun 25, 2020

Finance

  • Total approved costs

    78,085 thou. CZK

  • Public financial support

    78,085 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK