Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Methodological traps of parallel corpora and how to avoid them

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F17%3A10361115" target="_blank" >RIV/00216208:11210/17:10361115 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=0K6Il.LCJ5" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=0K6Il.LCJ5</a>

  • DOI - Digital Object Identifier

    <a href="http://dx.doi.org/10.4000/corela.4810" target="_blank" >10.4000/corela.4810</a>

Alternativní jazyky

  • Jazyk výsledku

    francouzština

  • Název v původním jazyce

    Pièges méthodologiques des corpus parallèles et comment les éviter

  • Popis výsledku v původním jazyce

    L&apos;objectif de cet article est de présenter certains problèmes méthodologiques liés a l&apos;exploitation de corpus parallèles, c&apos;est-a-dire de corpus composés de textes originaux et de leurs traductions respectives, et de proposer des principes et des règles d&apos;utilisation qui pourraient permettre de les résoudre. Sont traités successivement les facteurs liés a la taille et a la composition de corpus parallèles (section 2), les facteurs techniques tels que l&apos;alignement ou l&apos;annotation morphosyntaxique bilingue (section 3), la question épineuse de l&apos;équivalence des versions parallèles (4.1), l&apos;importance des métadonnées portant sur les originaux et sur les traductions (4.2) et les spécificités de la langue de traduction (4.3). Les différents principes méthodologiques sont illustrés par des recherches concrètes réalisées sur le corpus parallèle InterCorp.

  • Název v anglickém jazyce

    Methodological traps of parallel corpora and how to avoid them

  • Popis výsledku anglicky

    In this article, we present methodological problems pertaining to the exploitation of parallel corpora, i.e. corpora composed of translations and their respective originals, and we try to propose the principles and rules helping to avoid said problems. We treat successively factors of the size and composition of parallel corpora (section 2), technical factors such as alignment or bilingual POS-tagging (section 3), the tricky question of the equivalence of the parallel versions (4.1), the importance of metadata about the originals as well as the translations (4.2) and the particularities of the language of translation (4.3). The methodological principles are illustrated by specific studies on the parallel corpus InterCorp.

Klasifikace

  • Druh

    J<sub>ost</sub> - Ostatní články v recenzovaných periodicích

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2017

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    Cognition représentation langages [online]

  • ISSN

    1638-573X

  • e-ISSN

  • Svazek periodika

    15

  • Číslo periodika v rámci svazku

    1

  • Stát vydavatele periodika

    FR - Francouzská republika

  • Počet stran výsledku

    40

  • Strana od-do

    3

  • Kód UT WoS článku

  • EID výsledku v databázi Scopus