Modelování komplexity českých literárních textů

Název projektu anglicky
Modeling of complexity in Czech literary texts
Anotace anglicky
- Create a Czech data set based on the Hamburg Readability Concept. - Compare correlations between a comprehension test, subjective readability evaluation, and Hamburg readability criteria on the one hand and selected readability metrics on the other hand. - Adapt a readability metric to Czech according to the correlations identified. - Conduct a stylometric experiment with Czech texts and compare the accuracy with and without readability as a feature; the same with selected Slavic languages and English (using readability metrics without language-specific adaptation).

Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
60203 - Linguistics
OECD FORD - vedlejší obor
60201 - General language studies
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AI - Jazykověda

Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Vznikl datový soubor 91 parafrázovaných českých literárněvědných textů s naměřeným porozuměním čtenému na velkém vzorku probandů u 32 textů. Zároveň proběhla několikanásobná expertní anotace založená na tzv. Hamburském konceptu srozumitelnosti (Hamburger Verstándlichkeitskonzept). Anotace subjektivně škálově hodnotí různé aspekty textu, které prokazatelně ovlivňují jeho čtenářskou srozumitelnost. Data jsou podrobně dokumentována a dostupná pod licencí CC-BY v oborovém repozitáři Lindat/CLARlAH-CZ pod permanentním odkazem http://hdl.handle.net/11234/l-4610.Vznikla softwarová knihovna pro programovací jazyk R s názvem tidystopwords - pomocná knihovnu pro zpracování přirozeného jazyka a dolování textu. Knihovna je volně dostupná v repozitáři prostředí R pod permanentním odkazem https://CRAN.R-proiect.org/package=tidvstopwords. Publikovali jsme studii, která pomocí stylometrické knihovny stylo kvantifikuje, jak se autorský stylistický signál propisuje

Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP22-MSM-LT-U
Datum dodání záznamu
30. 6. 2022

Podobné projekty(10)