Cze-Lex: Kvantifikace českého lexikonu
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
SGA0202300001
Hlavní účastníci
Univerzita Karlova / Filozofická fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
23-06796S
Alternativní jazyk
Název projektu anglicky
Cze-Lex: A large-scale quantification of the Czech lexicon
Anotace anglicky
How is the Czech lexicon represented in the minds of those who use it? The proposed project will provide the first large-scale study that quantifies the psycholinguistic properties for thousands of Czech words. Using corpora from different genres and time periods, we will uncover the underlying statistical properties of words. From human participants (from diverse age groups - young, middle aged and older adults), we will collect normative ratings of the semantic properties of the words. These variables will then be used to statistically model Czech word processing in the different age populations. Finally, we will use Czech word embedding models to extrapolate new data from our psycholinguistic variables, providing full coverage across the whole Czech lexicon. This will be the first such resource available for Czech, which will aim to open up new research avenues for linguists, psychologists and cognitive scientists and provide novel insights into the way word meanings differ, or remain stable, across different demographic groups.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
50103 - Cognitive sciences
OECD FORD - vedlejší obor
60203 - Linguistics
OECD FORD - další vedlejší obor
50101 - Psychology (including human - machine relations)
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AI - Jazykověda<br>AN - Psychologie
Termíny řešení
Zahájení řešení
1. 1. 2023
Ukončení řešení
31. 12. 2025
Poslední stav řešení
K - Končící víceletý projekt
Poslední uvolnění podpory
29. 2. 2024
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP25-GA0-GA-R
Datum dodání záznamu
21. 2. 2025
Finance
Celkové uznané náklady
5 434 tis. Kč
Výše podpory ze státního rozpočtu
5 434 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč