Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Mnohojazyčný strojový překlad

Veřejná podpora

  • Poskytovatel

    Grantová agentura České republiky

  • Program

    Standardní projekty

  • Veřejná soutěž

    Standardní projekty 22 (SGA0201800001)

  • Hlavní účastníci

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    18-24210S

Alternativní jazyk

  • Název projektu anglicky

    Multilingual Machine Translation

  • Anotace anglicky

    Machine translation (MT) has experienced a major paradigm shift in 2016 and now it builds upon methods of deep learning. Neural MT (NMT) improved translation quality for many language pairs and it offers, i.a., multilingual translation. One multilingual system is trained jointly for several language pairs, benefiting from the relatedness of languages but also from less related data (e.g. German texts might improve MT from English to Czech). A big issue from the scientific point of view is the interpretability of the trained models. Models are represented as a collection of large matrices of real numbers and are generally treated as a black box. There is little insight into what is the model actually learning, what generalizations it can achieve and what limits the translation quality given the training data. We will build a multilingual MT system and devise and test various analytical methods for understanding the relations between trained models, language phenomena and language relatedness.

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • OECD FORD - hlavní obor

    60203 - Linguistics

  • OECD FORD - vedlejší obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

  • OECD FORD - další vedlejší obor

  • CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)

    AF - Dokumentace, knihovnictví, práce s informacemi<br>AI - Jazykověda<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika

Termíny řešení

  • Zahájení řešení

    1. 1. 2018

  • Ukončení řešení

    31. 12. 2022

  • Poslední stav řešení

  • Poslední uvolnění podpory

    25. 3. 2020

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP22-GA0-GA-R

  • Datum dodání záznamu

    22. 2. 2022

Finance

  • Celkové uznané náklady

    2 593 tis. Kč

  • Výše podpory ze státního rozpočtu

    2 146 tis. Kč

  • Ostatní veřejné zdroje financování

    447 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč