Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Using Term Position Similarity and Language Modeling for Bilingual Document Alignment

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F16%3A10335537" target="_blank" >RIV/00216208:11320/16:10335537 - isvavai.cz</a>

  • Výsledek na webu

    <a href="http://www.statmt.org/wmt16/pdf/W16-2371.pdf" target="_blank" >http://www.statmt.org/wmt16/pdf/W16-2371.pdf</a>

  • DOI - Digital Object Identifier

    <a href="http://dx.doi.org/10.18653/v1/w16-2371" target="_blank" >10.18653/v1/w16-2371</a>

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Using Term Position Similarity and Language Modeling for Bilingual Document Alignment

  • Popis výsledku v původním jazyce

    The WMT Bilingual Document Alignment Task requires systems to assign source pages to their "translations", in a big space of possible pairs. We present four methods: The first one uses the term position similarity between candidate document pairs. The second method requires automatically translated versions of the target text, and matches them with the candidates. The third and fourth methods try to overcome some of the challenges presented by the nature of the corpus, by considering the string similarity of source URL and candidate URL, and combining the first two approaches.

  • Název v anglickém jazyce

    Using Term Position Similarity and Language Modeling for Bilingual Document Alignment

  • Popis výsledku anglicky

    The WMT Bilingual Document Alignment Task requires systems to assign source pages to their "translations", in a big space of possible pairs. We present four methods: The first one uses the term position similarity between candidate document pairs. The second method requires automatically translated versions of the target text, and matches them with the candidates. The third and fourth methods try to overcome some of the challenges presented by the nature of the corpus, by considering the string similarity of source URL and candidate URL, and combining the first two approaches.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

    IN - Informatika

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

  • Rok uplatnění

    2016

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    Proceedings of the First Conference on Machine Translation (WMT). Volume 2: Shared Task Papers

  • ISBN

    978-1-945626-10-4

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    7

  • Strana od-do

    710-716

  • Název nakladatele

    Association for Computational Linguistics

  • Místo vydání

    Stroudsburg, PA, USA

  • Místo konání akce

    Berlin, Germany

  • Datum konání akce

    11. 8. 2016

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku