The lexical context in a style analysis: A word embeddings approach
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61988987%3A17250%2F21%3AA220209C" target="_blank" >RIV/61988987:17250/21:A220209C - isvavai.cz</a>
Výsledek na webu
<a href="https://www.degruyter.com/document/doi/10.1515/cllt-2018-0003/html" target="_blank" >https://www.degruyter.com/document/doi/10.1515/cllt-2018-0003/html</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1515/cllt-2018-0003" target="_blank" >10.1515/cllt-2018-0003</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
The lexical context in a style analysis: A word embeddings approach
Popis výsledku v původním jazyce
This is a pilot study of usability of Context Specificity measure for stylometric purposes. Specifically, the word embedding Word2vec approach based on measuring lexical context similarity between lemmas is applied to the analysis of texts that belong to different styles. Three types of Czech texts are investigated: fiction, non-fiction, and journalism. Specifically, forty lemmas were observed (10 lemmas each for verbs, nouns, adjectives, and adverbs). The aim of the present study is to introduce a concept of the Context Specificity and to test whether this measurement is sensitive to different styles. The results show that the proposed method Closest Context Specificity (CCS) is a corpus size independent method which has a promising potential in analyzing different styles.
Název v anglickém jazyce
The lexical context in a style analysis: A word embeddings approach
Popis výsledku anglicky
This is a pilot study of usability of Context Specificity measure for stylometric purposes. Specifically, the word embedding Word2vec approach based on measuring lexical context similarity between lemmas is applied to the analysis of texts that belong to different styles. Three types of Czech texts are investigated: fiction, non-fiction, and journalism. Specifically, forty lemmas were observed (10 lemmas each for verbs, nouns, adjectives, and adverbs). The aim of the present study is to introduce a concept of the Context Specificity and to test whether this measurement is sensitive to different styles. The results show that the proposed method Closest Context Specificity (CCS) is a corpus size independent method which has a promising potential in analyzing different styles.
Klasifikace
Druh
J<sub>imp</sub> - Článek v periodiku v databázi Web of Science
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Corpus Linguistics and Linguistic Theory
ISSN
1613-7035
e-ISSN
—
Svazek periodika
—
Číslo periodika v rámci svazku
17
Stát vydavatele periodika
DE - Spolková republika Německo
Počet stran výsledku
21
Strana od-do
443-464
Kód UT WoS článku
000704989600006
EID výsledku v databázi Scopus
2-s2.0-85057345638