All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Cze-Lex: A large-scale quantification of the Czech lexicon

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    SGA0202300001

  • Main participants

    Univerzita Karlova / Filozofická fakulta

  • Contest type

    VS - Public tender

  • Contract ID

    23-06796S

Alternative language

  • Project name in Czech

    Cze-Lex: Kvantifikace českého lexikonu

  • Annotation in Czech

    Jak je čeština reprezentována v myslích svých uživatelů? Navrhovaný projekt představuje první rozsáhlou studii, jejímž cílem je kvantifikace psycholingvistických vlastnostní tisíců českých slov. Na základě korpusů různých žánrů a časových období budou odhalovány statistické vlastnosti slov. Přímo od rodilých mluvčích češtiny (z mladší, střední a starší generace) budou získávány normativní hodnocení sémantických vlastností slov. Tyto proměnné pak budou použity ve statistickém modelu zpracování českých slov v různých věkových populacích. Kromě toho pro práci se získanými daty budou využívány modely vnoření slov v češtině (word embedding models). Celkově se bude jednat o první databázi tohoto typu dostupnou pro češtinu. Tato databáze bude následně sloužit lingvistům, psychologům a kognitivním vědcům a na jejím základě bude možné vysuzovat, nakolik se významy slov liší napříč různými generacemi mluvčích.

Scientific branches

  • R&D category

    ZV - Basic research

  • OECD FORD - main branch

    50103 - Cognitive sciences

  • OECD FORD - secondary branch

    60203 - Linguistics

  • OECD FORD - another secondary branch

    50101 - Psychology (including human - machine relations)

  • CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    AI - Linguistics<br>AN - Psychology

Solution timeline

  • Realization period - beginning

    Jan 1, 2023

  • Realization period - end

    Dec 31, 2025

  • Project status

    K - Ending multi-year project

  • Latest support payment

    Feb 29, 2024

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP25-GA0-GA-R

  • Data delivery date

    Feb 21, 2025

Finance

  • Total approved costs

    5,434 thou. CZK

  • Public financial support

    5,434 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK