All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Czech National Corpus

Public support

  • Provider

    Ministry of Education, Youth and Sports

  • Programme

  • Call for proposals

  • Main participants

    Univerzita Karlova / Filozofická fakulta

  • Contest type

    VL - Approved by the Government

  • Contract ID

    MSMT-44/2023

Alternative language

  • Project name in Czech

    Český národní korpus

  • Annotation in Czech

    Cílem CNC je kontinuální mapování českého jazyka prostřednictvím budování velkých elektronických jazykových korpusů a jejich zpřístupňování odborné i laické veřejnosti. CNC proto shromažďuje, zpracovává a anotuje velké množství jazykových dat pokrývajících řadu podob a variet češtiny, včetně češtiny psané, mluvené a internetové. Díky velkému rozsahu, pestrosti a vyváženosti složení, vysokému standardu zpracování, spolehlivým metadatům a kvalitní jazykové anotaci korpusů CNC se čeština řadí mezi datově nejlépe pokryté jazyky na světě. Klíčovým rysem je systematický a kontinuální charakter sběru dat, který umožňuje mj. provádění studií zaměřených na jazykový vývoj nebo na proměny veřejného diskurzu. Kromě vytváření korpusů poskytuje infrastruktura CNC dvě další hlavní služby: vývoj specializovaných analytických nástrojů v podobě webových aplikací, které umožňují efektivní a uživatelsky přívětivou práci s korpusovými daty, a dále komplexní a mnohostrannou uživatelskou podporu (dokumentace, znalostní báze, online poradna atd.). Centrálním přístupovým bodem ke všem aplikacím i k uživatelské podpoře je výzkumný portál CNC na adrese https://korpus.cz/. CNC se při své činnosti řídí politikou otevřeného přístupu, všechny služby jsou poskytovány zdarma.

Scientific branches

  • R&D category

    IF - RDI infrastructure

  • OECD FORD - main branch

    60203 - Linguistics

  • OECD FORD - secondary branch

  • OECD FORD - another secondary branch

  • CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    AI - Linguistics

Solution timeline

  • Realization period - beginning

    Jan 1, 2023

  • Realization period - end

    Dec 31, 2026

  • Project status

    B - Running multi-year project

  • Latest support payment

    Feb 17, 2024

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP24-MSM-LM-R

  • Data delivery date

    Feb 19, 2024

Finance

  • Total approved costs

    54,462 thou. CZK

  • Public financial support

    54,462 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK