Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

UMC005: English-Urdu Parallel Corpus

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F10%3A10079361" target="_blank" >RIV/00216208:11320/10:10079361 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    UMC005: English-Urdu Parallel Corpus

  • Popis výsledku v původním jazyce

    English-Urdu Parallel Corpus serves training of statistical machine translation between these two languages. It consists of four parts: 1. English-Urdu part of the EMILLE corpus; 2. texts from the Wall Street Journal (Penn Treebank); 3. translations of the Quran; 4. translations of the Bible. Parallel data that existed before (EMILLE) have been completely and newly manually cleaned, corrected alignment and many sentences on the Urdu side.

  • Název v anglickém jazyce

    UMC005: English-Urdu Parallel Corpus

  • Popis výsledku anglicky

    English-Urdu Parallel Corpus serves training of statistical machine translation between these two languages. It consists of four parts: 1. English-Urdu part of the EMILLE corpus; 2. texts from the Wall Street Journal (Penn Treebank); 3. translations of the Quran; 4. translations of the Bible. Parallel data that existed before (EMILLE) have been completely and newly manually cleaned, corrected alignment and many sentences on the Urdu side.

Klasifikace

  • Druh

    R - Software

  • CEP obor

    AI - Jazykověda

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    Z - Vyzkumny zamer (s odkazem do CEZ)<br>S - Specificky vyzkum na vysokych skolach

Ostatní

  • Rok uplatnění

    2010

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    UMC005

  • Technické parametry

    http://ufal.ms.mff.cuni.cz/umc/005-en-ur/

  • Ekonomické parametry

    Expanze na urdofonní trh.

  • IČO vlastníka výsledku

    00216208

  • Název vlastníka

    Univerzita Karlova v Praze