Modelování komplexity českých literárních textů
Veřejná podpora
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Program
INTER-EXCELLENCE
Veřejná soutěž
INTER-EXCELLENCE 13 (SMSM2018LTC01)
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
MSMT-16056/2018-11
Alternativní jazyk
Název projektu anglicky
Modeling of complexity in Czech literary texts
Anotace anglicky
- Create a Czech data set based on the Hamburg Readability Concept. - Compare correlations between a comprehension test, subjective readability evaluation, and Hamburg readability criteria on the one hand and selected readability metrics on the other hand. - Adapt a readability metric to Czech according to the correlations identified. - Conduct a stylometric experiment with Czech texts and compare the accuracy with and without readability as a feature; the same with selected Slavic languages and English (using readability metrics without language-specific adaptation).
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
60203 - Linguistics
OECD FORD - vedlejší obor
60201 - General language studies
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AI - Jazykověda
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Vznikl datový soubor 91 parafrázovaných českých literárněvědných textů s naměřeným porozuměním čtenému na velkém vzorku probandů u 32 textů. Zároveň proběhla několikanásobná expertní anotace založená na tzv. Hamburském konceptu srozumitelnosti (Hamburger Verstándlichkeitskonzept). Anotace subjektivně škálově hodnotí různé aspekty textu, které prokazatelně ovlivňují jeho čtenářskou srozumitelnost. Data jsou podrobně dokumentována a dostupná pod licencí CC-BY v oborovém repozitáři Lindat/CLARlAH-CZ pod permanentním odkazem http://hdl.handle.net/11234/l-4610.Vznikla softwarová knihovna pro programovací jazyk R s názvem tidystopwords - pomocná knihovnu pro zpracování přirozeného jazyka a dolování textu. Knihovna je volně dostupná v repozitáři prostředí R pod permanentním odkazem https://CRAN.R-proiect.org/package=tidvstopwords. Publikovali jsme studii, která pomocí stylometrické knihovny stylo kvantifikuje, jak se autorský stylistický signál propisuje
Termíny řešení
Zahájení řešení
1. 6. 2018
Ukončení řešení
1. 11. 2021
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
9. 3. 2021
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP22-MSM-LT-U
Datum dodání záznamu
30. 6. 2022
Finance
Celkové uznané náklady
4 695 tis. Kč
Výše podpory ze státního rozpočtu
4 695 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč