Czech National Corpus

Project name in Czech
Český národní korpus
Annotation in Czech
CNC kontinuálně mapuje český jazyk prostřednictvím budování a zpřístupňování rozsáhlých jazykových korpusů. Jazyková data shromažďovaná CNC pokrývají široké spektrum žánrů a forem (od současné psané češtiny, přes češtinu mluvenou až po starší češtinu). Pro srovnávací výzkum je sestavován také paralelní korpus InterCorp zahrnující texty společně s jejich překlady mezi češtinou a více než 30 světovými jazyky. CNC představuje unikátní zdroj autentických informací o jazyce jak pro základní a aplikovaný jazykovědný výzkum, tak pro další společenskovědní a humanitní obory. Jazykové zdroje CNC jsou široce využívány zejména pro svou kontinuální povahu, pestrost a vyváženost složení, spolehlivá metadata a vysokou kvalitu zpracování pomocí nejnovějších nástrojů. CNC poskytuje uživatelský přístup k rozsáhlým datům na základě specializovaného webového rozhraní a uživatelskou podporu koncentrovanou do výzkumného portálu www.korpus.cz, včetně on-line poradny, manuálu a báze znalostí z korpusové lingvistiky ve formě wiki. Poskytuje také datové balíčky vytvořené na základě specifických požadavků uživatelů. CNC je v současnosti jediným specializovaným pracovištěm v ČR, které se systematicky soustředí na rozvíjení metodologie korpusové lingvistiky.

R&D category
IF - RDI infrastructure
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
The focus of the project was to continually map the Czech language by creating and providing access to extensive databases of authentic texts (language corpora), which are used primarily in language-oriented empirical research in the humanities and social sciences. Overall, the project can be considered a very successful one, its progress having taken place in accordance with the proposed plan (with only several minor exceptions). The plan was adhered to also with regard to the extent and the goals of the project, in fact some of the goals were completed beyond the scope of what was stated in the plan

Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP20-MSM-LM-U/03:1
Data delivery date
Jun 25, 2020

Similar projects(10)