Syntakticko-sémantický popis vybraných skupin sloves vyjadřujících emoce a pocity - metody kontrastivního zkoumání valence na základě paralelního korpusu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F16%3A10336461" target="_blank" >RIV/00216208:11210/16:10336461 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Syntakticko-sémantický popis vybraných skupin sloves vyjadřujících emoce a pocity - metody kontrastivního zkoumání valence na základě paralelního korpusu
Popis výsledku v původním jazyce
Z paralelních korpusů lze získat pozoruhodné údaje o kombinatorických vlastnostech lexémů v kontrastivním pohledu. Podobné metody už posloužily ke kontrastivní česko-polské analýze deminutiv, identifikaci chybějících pojmů ve druhém jazyce a hledání ekvivalentů obtížně přeložitelných lexémů. Příspěvek se zaměří na metody, které pro výzkum valence srovnatelných lexémů: zarovnání po slovech s automatickou excerpcí lexikálních ekvivalentů, kolokační profily, automatickou syntaktickou analýzu s identifikací syntaktických argumentů, stochastický klasifikátor lexémů podle kontextu o velikosti několika slov bez syntaktické informace, nebo s omezením kontextu na slovní formy určité slovnědruhové třídy. Úspěšnost některých metod bude ověřena shodou s paralelními konkordancemi při úkolu vybrat nejvhodnější lexikální ekvivalent.
Název v anglickém jazyce
A Syntactico-semantic Description of Selected Groups of Verbs Expressing Emotions and Feelings - Methods of Contrastive Study of Valency Based on a Parallel Corpus
Popis výsledku anglicky
Our goal is to identify factors underlying the choice of equivalents of psych verbs when translating from Czech to Polish, using context and the syntactico-semantic properties of the source lexeme's syntactic arguments. We start with the relation of meaning to context and valency and an overview of options for studying and distinguishing meaning using a parallel corpus. Then we proceed with a manual valency-based analysis, examining parallel concordances of a Czech verb seen from the Polish perspective as highly polysemous (toužit 'to yearn, to desire'). The results, complemented and verified by a bilingual glossary automatically extracted from the parallel corpus, show that valency is not the only predictor of an appropriate target equivalent for a lexeme. In the second part of the study, we examine options for formalizing the choice of an equivalent using the source context of the lexeme. First, we focus on collocation profiles and syntactic analysis as methods for aggregating data about the object argument of the source lexeme and evaluate their reliability as cues for predicting the target equivalent. Finally, we turn to machine learning methods, using a stochastic classifier to determine equivalents in both linear and syntactically structured contexts. None of the above methods confirmed the hypothesis that valency is the main predictor for the choice of the target equivalent in general. It is not even obvious that methods based on syntactically structured contexts outperform those based on linear contexts. However, the study still yielded intermediate conclusions: of all syntactic dependents, the object argument is the best predictor, and valency can be the primary factor in specific cases (infinitival complements), the methods for extracting the binary glossary originally used for this research have been successfully applied to build a lexical database for many language pairs in the parallel corpus InterCorp, etc.
Klasifikace
Druh
C - Kapitola v odborné knize
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název knihy nebo sborníku
Výzkum slovesné valence ve slovanských zemích
ISBN
978-80-86420-60-8
Počet stran výsledku
32
Strana od-do
319-350
Počet stran knihy
440
Název nakladatele
Slovanský ústav Akademie věd České republiky
Místo vydání
Praha
Kód UT WoS kapitoly
—