Český národní korpus

Název projektu anglicky
Czech National Corpus
Anotace anglicky
The CNC is continuously mapping the Czech language by building large general-purpose language corpora and providing access to them. The CNC’s linguistic data cover a wide range of genres and language varieties, including written, spoken and diachronic Czech. In addition, the InterCorp parallel corpus contains original and translated texts in Czech and more than 30 other languages. The CNC corpora constitute a unique source of authentic language information for both basic and applied linguistic research, as well as for other domains of SSH. The CNC corpora are widely used thanks to their continuously growing size, varied and well-defined composition, reliable metadata and high quality data processing with state-of-the-art tools. The CNC provides intuitive access to its corpora through efficient, specialized web-based applications and user support featured at the CNC research portal www.korpus.cz that also includes User Forum (with Q&A, bug reporting etc.) and a corpus linguistics Wiki. It also provides data packages tailored to specific users’ needs. The CNC is the only centre in the country focusing systematically on developing the methodology of corpus linguistics.

Kategorie VaV
IF - Infrastruktura výzkumu, vývoje a inovací
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
—
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Projekt se soustředil na kontinuální mapování českého jazyka prostřednictvím vytváření a zpřístupňování rozsáhlých databází autentických textů (jazykových korpusů), které primárně slouží jazykově orientovanému empirickému výzkumu v oblasti společenských a humanitních věd. Projekt lze celkově hodnotit jako velmi úspěšný, jeho řešení probíhalo až na výjimky v souladu s plánem také co se týče rozsahu a cílů projektu, některé cíle byly dokonce splněny nad plán.

Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP20-MSM-LM-U/03:1
Datum dodání záznamu
25. 6. 2020

Podobné projekty(10)