Czech National Corpus
Public support
Provider
Ministry of Education, Youth and Sports
Programme
—
Call for proposals
—
Main participants
Univerzita Karlova / Filozofická fakulta
Contest type
VL - Approved by the Government
Contract ID
MSMT-1000/2016
Alternative language
Project name in Czech
Český národní korpus
Annotation in Czech
CNC kontinuálně mapuje český jazyk prostřednictvím budování a zpřístupňování rozsáhlých jazykových korpusů. Jazyková data shromažďovaná CNC pokrývají široké spektrum žánrů a forem (od současné psané češtiny, přes češtinu mluvenou až po starší češtinu). Pro srovnávací výzkum je sestavován také paralelní korpus InterCorp zahrnující texty společně s jejich překlady mezi češtinou a více než 30 světovými jazyky. CNC představuje unikátní zdroj autentických informací o jazyce jak pro základní a aplikovaný jazykovědný výzkum, tak pro další společenskovědní a humanitní obory. Jazykové zdroje CNC jsou široce využívány zejména pro svou kontinuální povahu, pestrost a vyváženost složení, spolehlivá metadata a vysokou kvalitu zpracování pomocí nejnovějších nástrojů. CNC poskytuje uživatelský přístup k rozsáhlým datům na základě specializovaného webového rozhraní a uživatelskou podporu koncentrovanou do výzkumného portálu www.korpus.cz, včetně on-line poradny, manuálu a báze znalostí z korpusové lingvistiky ve formě wiki. Poskytuje také datové balíčky vytvořené na základě specifických požadavků uživatelů. CNC je v současnosti jediným specializovaným pracovištěm v ČR, které se systematicky soustředí na rozvíjení metodologie korpusové lingvistiky.
Scientific branches
R&D category
IF - RDI infrastructure
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
The focus of the project was to continually map the Czech language by creating and providing access to extensive databases of authentic texts (language corpora), which are used primarily in language-oriented empirical research in the humanities and social sciences. Overall, the project can be considered a very successful one, its progress having taken place in accordance with the proposed plan (with only several minor exceptions). The plan was adhered to also with regard to the extent and the goals of the project, in fact some of the goals were completed beyond the scope of what was stated in the plan
Solution timeline
Realization period - beginning
Jan 1, 2016
Realization period - end
Dec 31, 2019
Project status
U - Finished project
Latest support payment
Feb 15, 2019
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP20-MSM-LM-U/03:1
Data delivery date
Jun 25, 2020
Finance
Total approved costs
78,085 thou. CZK
Public financial support
78,085 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK