Mnohojazyčný strojový překlad
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 22 (SGA0201800001)
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
18-24210S
Alternativní jazyk
Název projektu anglicky
Multilingual Machine Translation
Anotace anglicky
Machine translation (MT) has experienced a major paradigm shift in 2016 and now it builds upon methods of deep learning. Neural MT (NMT) improved translation quality for many language pairs and it offers, i.a., multilingual translation. One multilingual system is trained jointly for several language pairs, benefiting from the relatedness of languages but also from less related data (e.g. German texts might improve MT from English to Czech). A big issue from the scientific point of view is the interpretability of the trained models. Models are represented as a collection of large matrices of real numbers and are generally treated as a black box. There is little insight into what is the model actually learning, what generalizations it can achieve and what limits the translation quality given the training data. We will build a multilingual MT system and devise and test various analytical methods for understanding the relations between trained models, language phenomena and language relatedness.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
60203 - Linguistics
OECD FORD - vedlejší obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>AI - Jazykověda<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika
Termíny řešení
Zahájení řešení
1. 1. 2018
Ukončení řešení
31. 12. 2022
Poslední stav řešení
—
Poslední uvolnění podpory
25. 3. 2020
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP22-GA0-GA-R
Datum dodání záznamu
22. 2. 2022
Finance
Celkové uznané náklady
2 593 tis. Kč
Výše podpory ze státního rozpočtu
2 146 tis. Kč
Ostatní veřejné zdroje financování
447 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč