Cze-Lex: A large-scale quantification of the Czech lexicon
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
SGA0202300001
Main participants
Univerzita Karlova / Filozofická fakulta
Contest type
VS - Public tender
Contract ID
23-06796S
Alternative language
Project name in Czech
Cze-Lex: Kvantifikace českého lexikonu
Annotation in Czech
Jak je čeština reprezentována v myslích svých uživatelů? Navrhovaný projekt představuje první rozsáhlou studii, jejímž cílem je kvantifikace psycholingvistických vlastnostní tisíců českých slov. Na základě korpusů různých žánrů a časových období budou odhalovány statistické vlastnosti slov. Přímo od rodilých mluvčích češtiny (z mladší, střední a starší generace) budou získávány normativní hodnocení sémantických vlastností slov. Tyto proměnné pak budou použity ve statistickém modelu zpracování českých slov v různých věkových populacích. Kromě toho pro práci se získanými daty budou využívány modely vnoření slov v češtině (word embedding models). Celkově se bude jednat o první databázi tohoto typu dostupnou pro češtinu. Tato databáze bude následně sloužit lingvistům, psychologům a kognitivním vědcům a na jejím základě bude možné vysuzovat, nakolik se významy slov liší napříč různými generacemi mluvčích.
Scientific branches
R&D category
ZV - Basic research
OECD FORD - main branch
50103 - Cognitive sciences
OECD FORD - secondary branch
60203 - Linguistics
OECD FORD - another secondary branch
50101 - Psychology (including human - machine relations)
CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
AI - Linguistics<br>AN - Psychology
Solution timeline
Realization period - beginning
Jan 1, 2023
Realization period - end
Dec 31, 2025
Project status
K - Ending multi-year project
Latest support payment
Feb 29, 2024
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP25-GA0-GA-R
Data delivery date
Feb 21, 2025
Finance
Total approved costs
5,434 thou. CZK
Public financial support
5,434 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK