Popis slovotvorné struktury českých slov na základě jazykových dat
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 23 (SGA0201900001)
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
19-14534S
Alternativní jazyk
Název projektu anglicky
Word-formation structure of Czech words: a data-based research
Anotace anglicky
The project focuses on linguistic research into word-formation structure of Czech words using specialized language resources and tools and large language corpora. The research team, including linguists and experts in Natural Language Processing, concentrates on three closely connected topics. First, relations between word formation and corpus frequency of words are studied in order to discover how complex the morphemic structure of the top-frequent part of the Czech lexicon is and how it changes with decreasing frequency. The second task deals with distribution of suffixes with respect to the derivational history of given words and to the structure of word-formation nests. In the third task, direction of word-formation motivation is studied on selected groups of formations (esp. action nouns and words with loan bases). The research brings new insights into the word-formation system of Czech and verifies novel methodological accounts. Results will be published in journal articles and conference papers, and are expected to be relevant for teaching Czech as a foreign language.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
60203 - Linguistics
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AI - Jazykověda
Termíny řešení
Zahájení řešení
1. 1. 2019
Ukončení řešení
31. 12. 2023
Poslední stav řešení
—
Poslední uvolnění podpory
12. 5. 2021
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP22-GA0-GA-R
Datum dodání záznamu
22. 2. 2022
Finance
Celkové uznané náklady
3 940 tis. Kč
Výše podpory ze státního rozpočtu
3 448 tis. Kč
Ostatní veřejné zdroje financování
492 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč