Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”
LTC18020

Modelování komplexity českých literárních textů

Veřejná podpora

  • Poskytovatel

    Ministerstvo školství, mládeže a tělovýchovy

  • Program

    INTER-EXCELLENCE

  • Veřejná soutěž

    INTER-EXCELLENCE 13 (SMSM2018LTC01)

  • Hlavní účastníci

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    MSMT-16056/2018-11

Alternativní jazyk

  • Název projektu anglicky

    Modeling of complexity in Czech literary texts

  • Anotace anglicky

    - Create a Czech data set based on the Hamburg Readability Concept. - Compare correlations between a comprehension test, subjective readability evaluation, and Hamburg readability criteria on the one hand and selected readability metrics on the other hand. - Adapt a readability metric to Czech according to the correlations identified. - Conduct a stylometric experiment with Czech texts and compare the accuracy with and without readability as a feature; the same with selected Slavic languages and English (using readability metrics without language-specific adaptation).

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • OECD FORD - hlavní obor

    60203 - Linguistics

  • OECD FORD - vedlejší obor

    60201 - General language studies

  • OECD FORD - další vedlejší obor

  • CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)

    AI - Jazykověda

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Zhodnocení výsledků projektu

    Vznikl datový soubor 91 parafrázovaných českých literárněvědných textů s naměřeným porozuměním čtenému na velkém vzorku probandů u 32 textů. Zároveň proběhla několikanásobná expertní anotace založená na tzv. Hamburském konceptu srozumitelnosti (Hamburger Verstándlichkeitskonzept). Anotace subjektivně škálově hodnotí různé aspekty textu, které prokazatelně ovlivňují jeho čtenářskou srozumitelnost. Data jsou podrobně dokumentována a dostupná pod licencí CC-BY v oborovém repozitáři Lindat/CLARlAH-CZ pod permanentním odkazem http://hdl.handle.net/11234/l-4610.Vznikla softwarová knihovna pro programovací jazyk R s názvem tidystopwords - pomocná knihovnu pro zpracování přirozeného jazyka a dolování textu. Knihovna je volně dostupná v repozitáři prostředí R pod permanentním odkazem https://CRAN.R-proiect.org/package=tidvstopwords. Publikovali jsme studii, která pomocí stylometrické knihovny stylo kvantifikuje, jak se autorský stylistický signál propisuje

Termíny řešení

  • Zahájení řešení

    1. 6. 2018

  • Ukončení řešení

    1. 11. 2021

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    9. 3. 2021

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP22-MSM-LT-U

  • Datum dodání záznamu

    30. 6. 2022

Finance

  • Celkové uznané náklady

    4 695 tis. Kč

  • Výše podpory ze státního rozpočtu

    4 695 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč