Methods for determining equivalents of verbs expressing emotional states in the Czech-Polish translation on the material from the InterCorp parallel corpus
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F19%3A10426235" target="_blank" >RIV/00216208:11210/19:10426235 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
polština
Název v původním jazyce
Metody ustalania ekwiwalentów czasowników wyrażających stany emocjonalne w przekładzie czesko-polskim na materiale z korpusu równoległego InterCorp
Popis výsledku v původním jazyce
Metody określania ekwiwalentów czasowników wyrażających emocje w tłumaczeniu z czeskiego na polski na podstawie tekstów z równoległego korpusu InterCorp Niniejsza praca skupia się na problemie określenia polskich odpowiedników czeskich czasowników. Celem analizy jest zbadanie, która metoda najlepiej poradzi sobie z tym zadaniem i jakie czynniki decydują o wyborze odpowiednika. Przedmiotem analizy są czeskie jednostki leksykalne odnoszące się do różnych stanów psychicznych lub emocjonalnych. Chociaż czeski jest językiem blisko spokrewnionym z polskim i można by naiwnie oczekiwać, że fałszywi przyjaciele będą stanowić główne wyzwanie, znalezienie odpowiedniego polskiego odpowiednika dla większości tego typu leksemów wiąże się z wieloma problemami, które często pojawiają się w tłumaczeniach z bardziej odległych typologicznie języków. Dotyczy to zarówno zadania dekodowania znaczenia leksemu w tekście źródłowym zgodnie z wzorcami pojęciowymi języka źródłowego, jak i kodowania znaczenia w języku docelowym zgodnie z jego wzorcami pojęciowymi. W celu zbadania czynników odpowiedzialnych za optymalny dobór ekwiwalentu, badanie prowadzone jest na tekstach z równoległego korpusu. Teksty równoległe dają szansę zbadania wielu wystąpień leksemów źródłowych i docelowych w ich kontekstach, badanych z perspektywy morfosyntaktycznej, syntaktycznej, semantycznej i pragmatycznej, w tym szczegółów dotyczących sytuacji, w których używane są leksemy, a także szczegółów dotyczących samego tekstu. Biorąc pod uwagę trudny wybór czasowników psychologicznych, tekstami najlepiej odpowiadającymi potrzebom badawczym są teksty beletrystyczne lub teksty podobnego typu. InterCorp to równoległy korpus, który zawiera znaczną część takich tekstów. Na podstawie dostępnych leksykonów i danych z korpusu zadanie znalezienia najlepiej dopasowanego odpowiednika można następnie podejść z różnych perspektyw, co skutkuje sekwencją kroków, z których każdy odwołuje się do metody poszukiwania odpowiednika. Perspektywy łączą podejścia translatologii, językoznawstwa teoretycznego i językoznawstwa korpusowego. Przez pryzmat przekładu autorka ukazuje możliwości zastosowania różnych teorii lingwistycznych (teoria wartościowości, Case Grammar, Pattern Grammar) oraz narzędzi korpusowych (Treq, Sketch Engine), demonstrując zalety zastosowania korpusu równoległego, ale także identyfikując jego ograniczenia . W oparciu o te zasoby zaproponowano algorytm określania polskich odpowiedników czeskich czasowników. Program jest odzwierciedlony w konspekcie książki, która składa się z trzynastu rozdziałów, najlepiej postrzeganych jako cztery części - teoretyczna i związana z danymi (rozdziały 1-4), analityczna (rozdziały 5-10), dotycząca propozycji (rozdziały 11 -12) i podsumowanie (rozdział 13). Bibliografia i indeksy zamykają tom. W stosownych przypadkach tekst jest obszernie zilustrowany przykładami i uzupełniony tabelami podsumowującymi dane statystyczne. Po krótkim wprowadzeniu w rozdziale 2 omówiono zagadnienia teoretyczne dotyczące równoważności i tłumaczenia, a także przedstawiono różne definicje równoważności oraz związek między tłumaczeniem tradycyjnym a automatycznym dopasowaniem. Następny rozdział zawiera komentarze na temat korelacji tłumaczenia i badań kontrastowych (rozdział 3). Korpus równoległy InterCorp został przedstawiony w rozdziale 4, wraz ze szczegółami jego czesko-polskiej sekcji i szczegółami dotyczącymi Treq, bazy danych ekwiwalentów leksykalnych wyodrębnionych z równoległego korpusu. Rozdział 5 przedstawia metodologię zastosowaną w sześciu kolejnych studiach przypadków, z których każde dotyczy czeskiego leksemu słownego. Część teoretyczna obejmuje rozdziały prezentujące te studia przypadków: zdát se 'zdają się' (rozdział 6), trápit (se) 'przeszkadzać, martwić się, męczyć' (rozdział 7), soucítit 'sympathize' (rozdział 8), závidět 'zazdrość' i žárlit "bądź zazdrosny" (rozdział 9), mít rád "jak" i milovat "miłość" (rozdział 10). Poniższy rozdział przedstawia algorytm ułatwiający określenie odpowiedników. Procedura składa się z następujących kroków: przeszukiwanie słownika, automatyczne wyodrębnianie par równoważnych z korpusu równoległego, analiza wartościowościowa, analiza pod względem gramatyki przypadków (przypadki głębokie), analiza pod względem gramatyki wzorców i analiza z wykorzystaniem innych metod lub zasoby: Word Sketch, WordNet, WoSeDon, Cognitive Grammar (Rozdział 11). Algorytm jest zilustrowany w następnym rozdziale, studium przypadku czeskiego czasownika toužit "pragnienie" (rozdział 12). Każdy z kroków jest szczegółowo opisany i zilustrowany, aby pokazać zakres użyteczności ogólnej metodologii i każdego z indywidualnych podejść, w tym przypadki, w których krok nie prowadzi do pożądanego rezultatu. Podsumowanie wskazuje na dalsze perspektywy badawcze (rozdział 13). W monografii przedstawiono analizę interdyscyplinarną, łączącą podejścia lingwistyki i translatologii z elementami statystyki i lingwistyki obliczeniowej, opartą na danych z równoległego korpusu. Analiza prowadzi do zaprojektowania procedury mającej na celu wybór najbardziej odpowiedniego odpowiednika leksykalnego.
Název v anglickém jazyce
Methods for determining equivalents of verbs expressing emotional states in the Czech-Polish translation on the material from the InterCorp parallel corpus
Popis výsledku anglicky
Methods of determining equivalents of verbs expressing emotions in translation from Czech to Polish, based on texts from the InterCorp parallel corpus This study focuses on the problem of determining Polish equivalents of Czech verbs. The aim of the analysis is to explore which method can best handle this task and what factors determine the choice of the equivalent. The object of the analysis are Czech lexical units referring to various mental or emotional states. Although Czech is a language closely related to Polish and false friends might be naively expected to pose the main challenge, finding an appropriate Polish equivalent for most lexemes of this type involves many issues common in translation from typologically more distant languages. This concerns both the task of decoding the meaning of the lexeme in the source text according to the conceptual patterns of the source language as well as encoding the meaning in the target language according to its conceptual patterns. To study factors responsible for an optimal choice of an equivalent, the inquiry is carried out on texts from a parallel corpus. Parallel texts offer the chance to examine many occurrences of the source and target lexemes in their contexts, investigated from the morphosyntactic, syntactic, semantic and pragmatic perspectives, including details about the situation in which the lexemes are used and details about the text itself. Given the challenging choice of psych verbs, the texts that best meet the research needs are fiction texts or texts of a similar type. InterCorp is a parallel corpus that includes a substantial share of such texts. On the basis of available lexicons and the corpus data, the task to find the best fitting equivalent can then be approached from various perspectives, resulting in a sequence of steps, each invoking a method of searching for an equivalent. The perspectives combine the approaches of translatology, theoretical linguistics and corpus linguistics. Through the prism of translation, the author shows the possibilities of applying various linguistic theories (valency theory, Case Grammar, Pattern Grammar) and corpus tools (Treq, Sketch Engine), demonstrating the merits of using the parallel corpus, but also identifying its limitations. Building on these resources, an algorithm to determine Polish equivalents for the Czech verbs is proposed. The agenda is reflected in the outline of the book, which consists of thirteen chapters, best seen as forming four parts - theoretical and data-related (Chapters 1-4), analytical (Chapters 5-10), proposal-related (Chapters 11-12), and a summary (Chapter 13). Bibliography and indexes conclude the volume. Whenever appropriate, the text is amply illustrated with examples and accompanied by tables, summarizing statistical data. After a short introduction, Chapter 2 discusses theoretical issues concerning equivalence and translation, as well as presenting various definitions of equivalence and the relationship between traditional translation and automatic alignment. The next chapter includes comments on the correlation of translation and contrastive studies (Chapter 3). The InterCorp parallel corpus is presented in Chapter 4, together with specifics of its Czech-Polish section and details about Treq, the database of lexical equivalents extracted from the parallel corpus. Chapter 5 introduces the methodology used in the six following case studies, each concerned with a Czech verbal lexeme. The theoretical part proceeds with chapters presenting these case studies: zdát se 'seem' (Chapter 6), trápit (se) 'bother, worry, torment' (Chapter 7), soucítit 'sympathize' (Chapter 8), závidět 'envy' and žárlit 'be jealous' (Chapter 9), mít rád 'like' and milovat 'love' (Chapter 10). The following chapter presents an algorithm that facilitates the determination of equivalents. The procedure consists of the following steps: dictionary lookup, automatic extraction of equivalent pairs from the parallel corpus, valency-based analysis, analysis in terms of Case Grammar (deep cases), analysis in terms of Pattern Grammar, and analysis employing other methods or resources: Word Sketch, WordNet, WoSeDon, Cognitive Grammar (Chapter 11). The algorithm is exemplified in the following chapter, a case study of the Czech verb toužit 'desire' (chapter 12). Each of the steps is described in detail and exemplified to show the extent of usability of the overall methodology and of each of the individual approaches, including cases where the step does not lead to a desirable outcome. The concluding summary indicates further research perspectives (Chapter 13). The monograph presents an interdisciplinary analysis, combining the approaches of linguistics and translatology, together with elements of statistics and computational linguistics, based on data from a parallel corpus. The analysis results in the design of a procedure aiming at the choice of the most fitting lexical equivalent. Recent years have seen a number of research results published in the field combining corpus linguistics and translation. However, most of them concern English. Yet this study is unique not only due to the languages studied, but also due to the methods employed, especially methods from the borderline of translation studies and comparative analysis.
Klasifikace
Druh
B - Odborná kniha
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
—
Návaznosti
—
Ostatní
Rok uplatnění
2019
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
ISBN
978-83-65667-92-2
Počet stran knihy
254
Název nakladatele
Wydział Polonistyki Uniwersytet Warszawsk
Místo vydání
Varšava
Kód UT WoS knihy
—