Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Application of POS Tagging in Machine Translation Evaluation

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216275%3A25410%2F16%3A39902476" target="_blank" >RIV/00216275:25410/16:39902476 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Application of POS Tagging in Machine Translation Evaluation

  • Popis výsledku v původním jazyce

    The aim of the paper is to present a process of natural language processing in its full extent as well as in machine translation from English language into Slovak as a representative of inflectional language. We aim at the data preparation phase for automatic evaluation of machine translation through POS tagging. The preparation phase for MT evaluation consists of several steps, but only the first step - creation of dataset-parallel corpus is deeply described. We focus on the source text collection of various styles and genres-dataset creation and machine translation collection. Two machine translation systems are used-web SMT Google translator API and MT@EC. As a morphology analyzing tool-TreeTagger is used. The process of dataset creation, which covers not only parallel corpora creation, but also creation of errors' database of Slovak words with morphological annotation, is analyzed. The main contribution consists of a novel approach to research of MT evaluation given by the POS tagging (machine learning methods), to identify differences between MT output and post-edited machine translation output. The ground essential of the research is machine translation errors analysis, their identification and classification, from English language into Slovak.

  • Název v anglickém jazyce

    Application of POS Tagging in Machine Translation Evaluation

  • Popis výsledku anglicky

    The aim of the paper is to present a process of natural language processing in its full extent as well as in machine translation from English language into Slovak as a representative of inflectional language. We aim at the data preparation phase for automatic evaluation of machine translation through POS tagging. The preparation phase for MT evaluation consists of several steps, but only the first step - creation of dataset-parallel corpus is deeply described. We focus on the source text collection of various styles and genres-dataset creation and machine translation collection. Two machine translation systems are used-web SMT Google translator API and MT@EC. As a morphology analyzing tool-TreeTagger is used. The process of dataset creation, which covers not only parallel corpora creation, but also creation of errors' database of Slovak words with morphological annotation, is analyzed. The main contribution consists of a novel approach to research of MT evaluation given by the POS tagging (machine learning methods), to identify differences between MT output and post-edited machine translation output. The ground essential of the research is machine translation errors analysis, their identification and classification, from English language into Slovak.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

    IN - Informatika

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    S - Specificky vyzkum na vysokych skolach

Ostatní

  • Rok uplatnění

    2016

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    DIVAI 2016 - 11th International Scientific Conference on Distance Learning in Applied Informatics

  • ISBN

    978-80-7552-249-8

  • ISSN

    2464-7470

  • e-ISSN

  • Počet stran výsledku

    9

  • Strana od-do

    471-479

  • Název nakladatele

    Wolters Kluwer ČR, a. s.

  • Místo vydání

    Praha

  • Místo konání akce

    Štúrovo

  • Datum konání akce

    2. 5. 2016

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku

    000386971000040