Vše
Vše

Co hledáte?

Vše
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”
LM2018137

Český národní korpus

Cíle projektu

CNC kontinuálně mapuje český jazyk prostřednictvím budování rozsáhlých jazykových korpusů a jejich zpřístupňování pomocí webových uživatelských rozhraní. Jazykové korpusy budované CNC pokrývají široké spektrum žánrů a forem: od současné psané češtiny, přes češtinu mluvenou až po starší vývojové podoby češtiny; dále je pro srovnávací výzkum budován také paralelní korpus zahrnující texty společně s jejich překlady mezi češtinou a přibližně 40 dalšími jazyky. Korpusy CNC jsou široce využívány zejména pro svoji kontinuální povahu, pestrost a vyváženost složení, spolehlivá metadata a vysokou kvalitu anotace pomocí nejnovějších nástrojů. Neméně důležitou součástí činnosti CNC je vývoj specializovaných, efektivních, a přitom uživatelsky přívětivých webových rozhraní používaných pro přístup ke korpusům. Tato rozhraní jsou spolu s rozsáhlou uživatelskou podporou (on-line poradna, manuály, báze znalostí z korpusové lingvistiky, korpusová cvičení pro školy aj.) koncentrována do výzkumného portálu http://www.korpus.cz/. CNC tak představuje unikátní zdroj autentických informací o jazyce nejenom pro jazykovědný výzkum, ale také pro další společenskovědní a humanitní obory.

Klíčová slova

language corpuscorpus linguisticslinguistic annotationCzech

Veřejná podpora

  • Poskytovatel

    Ministerstvo školství, mládeže a tělovýchovy

  • Program

    Projekty velkých výzkumných infrastruktur

  • Veřejná soutěž

  • Hlavní účastníci

    Univerzita Karlova / Filozofická fakulta

  • Druh soutěže

    VL - Schváleno vládou

  • Číslo smlouvy

    MSMT-33353/2019-36

Alternativní jazyk

  • Název projektu anglicky

    Czech National Corpus

  • Anotace anglicky

    CNC is continuously mapping the Czech language by building large language corpora and providing access to them by the means of user web applications. The CNC language corpora cover a wide range of genres and varieties, including written, spoken and historical Czech. In addition, CNC also builds a parallel corpus that contains original and translated texts in Czech and approx 40 other languages. The CNC corpora are widely used thanks to their continuously growing size, varied and well-defined composition, reliable metadata and high-quality annotation with state-of-the-art tools. An important part of the CNC activities is the development of specialized, effective, yet user-friendly web applications used for providing access to the corpora. The applications are concentrated at the CNC research portal http://www.korpus.cz/ and supplemented by comprehensive user support (on-line helpdesk, manuals, corpus linguistics knowledge base, corpus-based exercises for schools etc.). CNC thus constitutes a unique source of authentic language information mostly for linguistic research, as well as for other domains of social sciences and humanities.

Vědní obory

  • Kategorie VaV

    IF - Infrastruktura výzkumu, vývoje a inovací

  • OECD FORD - hlavní obor

    60203 - Linguistics

  • OECD FORD - vedlejší obor

  • OECD FORD - další vedlejší obor

  • CEP - odpovídající obory
    (dle převodníku)

    AI - Jazykověda

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Zhodnocení výsledků projektu

    Velká výzkumná infrastruktura poskytovala služby vědecké komunitě z ČR i zahraničí v souladu s cíli projektu a zajišťovala účast České republiky v nadnárodních strukturách. Jak výkonem svých služeb na domácí půdě, tak svým mezinárodním přesahem projekt zcela naplnil své poslání.

Termíny řešení

  • Zahájení řešení

    1. 1. 2020

  • Ukončení řešení

    31. 12. 2022

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    20. 4. 2022

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP23-MSM-LM-U

  • Datum dodání záznamu

    30. 6. 2023

Finance

  • Celkové uznané náklady

    67 726 tis. Kč

  • Výše podpory ze státního rozpočtu

    67 726 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč

Základní informace

Uznané náklady

67 726 tis. Kč

Statní podpora

67 726 tis. Kč

100%


Poskytovatel

Ministerstvo školství, mládeže a tělovýchovy

OECD FORD

Linguistics

Doba řešení

01. 01. 2020 - 31. 12. 2022