Historie češtiny v korpusovém kontinuu
Veřejná podpora
Poskytovatel
Technologická agentura ČR
Program
Program na podporu aplikovaného výzkumu a inovací SIGMA
Veřejná soutěž
STA02023TQ010
Hlavní účastníci
Univerzita Karlova / Filozofická fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
TQ01000072 - Smlouva o poskytnutí podpory
Alternativní jazyk
Název projektu anglicky
History of Czech in Corpus Continuum
Anotace anglicky
The HiČKoK project aims to contribute to digitization in education by creating data, software and knowledge resources for the study of Czech across its history (from the 13th to the 21st century). Its implementation should result in compiling and providing access to: (a) a Monitor corpus (MKČ) covering all developmental stages in the history of Czech (see appendix for more info) (b) language models in the Universal Dependencies (UD) scheme, for automatic linguistic annotation of texts from any time period (c) a Timeline Maker application allowing to study diachronic phenomena in the Monitor corpus (d) an online course for students and researchers working with historical texts, covering the outputs of the project and other relevant technologies available within the project consortium.
Vědní obory
Kategorie VaV
VV - Experimentální vývoj
OECD FORD - hlavní obor
60203 - Linguistics
OECD FORD - vedlejší obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - další vedlejší obor
50302 - Education, special (to gifted persons, those with learning disabilities)
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>AI - Jazykověda<br>AM - Pedagogika a školství<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika
Termíny řešení
Zahájení řešení
1. 9. 2023
Ukončení řešení
30. 11. 2026
Poslední stav řešení
B - Běžící víceletý projekt
Poslední uvolnění podpory
30. 10. 2023
Dodání dat do CEP
Důvěrnost údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Systémové označení dodávky dat
CEP24-TA0-TQ-R
Datum dodání záznamu
20. 2. 2024
Finance
Celkové uznané náklady
10 734 tis. Kč
Výše podpory ze státního rozpočtu
8 588 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
2 151 tis. Kč