Celkom iste sa príde na to, že niektoré slová sa opakujú doslovne: Horeckého hypersyntax
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989592%3A15210%2F20%3A73604189" target="_blank" >RIV/61989592:15210/20:73604189 - isvavai.cz</a>
Výsledek na webu
<a href="https://content.sciendo.com/view/journals/jazcas/71/2/article-p185.xml" target="_blank" >https://content.sciendo.com/view/journals/jazcas/71/2/article-p185.xml</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.2478/jazcas-2020-0021" target="_blank" >10.2478/jazcas-2020-0021</a>
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Celkom iste sa príde na to, že niektoré slová sa opakujú doslovne: Horeckého hypersyntax
Popis výsledku v původním jazyce
Článek reflektuje lingvistické práce Jána Horeckého, a to v souvislosti s oblastí hypersyntaxe a textové lingvistiky. V práci Základy jazykovedy Ján Horecký upozorňuje na to, že principem konstrukce textu může být doslovné opakování určitých slovních forem (1974, s. 90). Tento předpoklad v článku prověřujeme a pokoušíme se vyjádřit jeho souvislosti se všeobecnými předpoklady v rámci tzv. langue-parolové hypotézy a také v souvislosti s textovou kohezí a izotopií. Hlavním úkolem článku je experimentálně prověřit Horeckého předpoklad. Pro tytu účely provádíme analýzu určování autorství dvou slovenských autorů, Svetozára Hurbana Vajanského a Martina Kukučína. Zaměřujeme se na nízko frekventované lexikum (hapax legomena), tato složka slovní zásoby je považována za nezávislou na autorském stylu (Binongo, 2003) a předpokládá se, že odráží náhodné okolnosti komunikace (de Saussure, 1996, s. 50; Bloomfield, 1933, s. 170). Vycházíme z toho, že pokud by struktura textu obsahovala určité repetice slovních forem, nízko frekventovaná složka slovní zásoby by o tom obsahovala evidenci, a to bez závislosti na obsahu textu a stylu díla, což jsou faktory, které přímo ovlivňují přítomnost určitého lexika v textu a ovlivňuje to klastrování textů (Baayen, 1996). Analýza je založena na samostatném vydělení hapax legomen ze slovníku textů, stejně tak vydělujeme hapaxy slovních n-gramů textu. Na matici hapaxů a n-gramů hapaxů aplikujeme kosinovou nepodobnost a metodu vícerozměrného škálování (Torgerson, 1952). Oproti všeobecným předpokladům o struktuře textu se ukazuje, že autorské texty obsahují určitá opakovaná slova a slova v určitých frázích (jak napovídá n-gramová analýza), a to i v případě nízko frekventovaných slov.
Název v anglickém jazyce
It will certainly be found that some words are literally repeated: Horecký’s hypersyntax
Popis výsledku anglicky
The article reflects the linguistic work of Ján Horecký in connection with hyper syntax and text linguistics. In his work Základy jazykovedy (Outline of linguistics) Ján Horecký remarks (1974, p. 90) that one of the principles of text construction is the literal repetition of certain words. We discuss this Horecký’s assumption and describe its consequences for the langue parole opposition and the concepts of textual isotopy and textual cohesion. The main task of the article is to examine Horeský’s assumption. For these purposes, we present an authorship attribution analysis of literary works by two Slovak authors: Svetozár Hurban Vajanský and Martin Kukučín. We focus on low-frequency lexicon, i.e. hapax legomena, which are supposed to be independent of the authorial style (e.g. Binongo, 2003) and should reflect random circumstances of communication (de Saussure, 1996, p. 50; Bloomfield, 1933, p. 170). This means that if the structure of the text were to be affected by the repetition of certain words, the low frequency layer of the lexicon should contain evidence of this repetition with a low degree of dependence on the content and style of the literary work (Baayen, 1996). The analysis and its presentation is based on separate processing of hapax legomena and their n-grams, cosine dissimilarity and multidimensional scaling (Torgerson, 1952). Contrary to the general notion of the text structure, we conclude that the authorial texts are based on the repetition of certain word forms and word forms combinations (by n-gram analysis), even in the level of low-frequency words.
Klasifikace
Druh
J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
—
Návaznosti
O - Projekt operacniho programu
Ostatní
Rok uplatnění
2020
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Jazykovedny Casopis
ISSN
0021-5597
e-ISSN
—
Svazek periodika
71
Číslo periodika v rámci svazku
2
Stát vydavatele periodika
DE - Spolková republika Německo
Počet stran výsledku
12
Strana od-do
185-196
Kód UT WoS článku
—
EID výsledku v databázi Scopus
2-s2.0-85100213758