CUNI Systems for the WMT 22 Czech-Ukrainian Translation Task
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F22%3A10457055" target="_blank" >RIV/00216208:11320/22:10457055 - isvavai.cz</a>
Výsledek na webu
<a href="https://statmt.org/wmt22/pdf/2022.wmt-1.30.pdf" target="_blank" >https://statmt.org/wmt22/pdf/2022.wmt-1.30.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
CUNI Systems for the WMT 22 Czech-Ukrainian Translation Task
Popis výsledku v původním jazyce
We present Charles University submissions to the WMT22 General Translation Shared Task on Czech-Ukrainian and Ukrainian-Czech machine translation. We present two constrained submissions based on block back-translation and tagged back-translation and experiment with rule-based romanization of Ukrainian. Our results show that romanization only has a minor effect on the translation quality. Further, we describe Charles Translator, a system developed in March 2022 as a response to the migration from Ukraine to the Czech Republic. Compared to our constrained systems, it did not use romanization and used some proprietary data sources.
Název v anglickém jazyce
CUNI Systems for the WMT 22 Czech-Ukrainian Translation Task
Popis výsledku anglicky
We present Charles University submissions to the WMT22 General Translation Shared Task on Czech-Ukrainian and Ukrainian-Czech machine translation. We present two constrained submissions based on block back-translation and tagged back-translation and experiment with rule-based romanization of Ukrainian. Our results show that romanization only has a minor effect on the translation quality. Further, we describe Charles Translator, a system developed in March 2022 as a response to the migration from Ukraine to the Czech Republic. Compared to our constrained systems, it did not use romanization and used some proprietary data sources.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů