Methodological traps of parallel corpora and how to avoid them
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F17%3A10361115" target="_blank" >RIV/00216208:11210/17:10361115 - isvavai.cz</a>
Výsledek na webu
<a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=0K6Il.LCJ5" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=0K6Il.LCJ5</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.4000/corela.4810" target="_blank" >10.4000/corela.4810</a>
Alternativní jazyky
Jazyk výsledku
francouzština
Název v původním jazyce
Pièges méthodologiques des corpus parallèles et comment les éviter
Popis výsledku v původním jazyce
L'objectif de cet article est de présenter certains problèmes méthodologiques liés a l'exploitation de corpus parallèles, c'est-a-dire de corpus composés de textes originaux et de leurs traductions respectives, et de proposer des principes et des règles d'utilisation qui pourraient permettre de les résoudre. Sont traités successivement les facteurs liés a la taille et a la composition de corpus parallèles (section 2), les facteurs techniques tels que l'alignement ou l'annotation morphosyntaxique bilingue (section 3), la question épineuse de l'équivalence des versions parallèles (4.1), l'importance des métadonnées portant sur les originaux et sur les traductions (4.2) et les spécificités de la langue de traduction (4.3). Les différents principes méthodologiques sont illustrés par des recherches concrètes réalisées sur le corpus parallèle InterCorp.
Název v anglickém jazyce
Methodological traps of parallel corpora and how to avoid them
Popis výsledku anglicky
In this article, we present methodological problems pertaining to the exploitation of parallel corpora, i.e. corpora composed of translations and their respective originals, and we try to propose the principles and rules helping to avoid said problems. We treat successively factors of the size and composition of parallel corpora (section 2), technical factors such as alignment or bilingual POS-tagging (section 3), the tricky question of the equivalence of the parallel versions (4.1), the importance of metadata about the originals as well as the translations (4.2) and the particularities of the language of translation (4.3). The methodological principles are illustrated by specific studies on the parallel corpus InterCorp.
Klasifikace
Druh
J<sub>ost</sub> - Ostatní články v recenzovaných periodicích
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Cognition représentation langages [online]
ISSN
1638-573X
e-ISSN
—
Svazek periodika
15
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
FR - Francouzská republika
Počet stran výsledku
40
Strana od-do
3
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—