Improving SMT by Using Parallel Data of a Closely Related Language
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F12%3A10130044" target="_blank" >RIV/00216208:11320/12:10130044 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.booksonline.iospress.nl/Content/View.aspx?piid=32319" target="_blank" >http://www.booksonline.iospress.nl/Content/View.aspx?piid=32319</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.3233/978-1-61499-133-5-58" target="_blank" >10.3233/978-1-61499-133-5-58</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Improving SMT by Using Parallel Data of a Closely Related Language
Popis výsledku v původním jazyce
The amount of training data in statistical machine translation is critical for translation quality. In this paper, we demonstrate how to increase translation quality for one language pair by bringing in parallel data from a closely related language. In particular, we improve enRIGHTWARDS ARROWsk translation using a large Czech-English parallel corpus and a shallow (rule-based) MT system for csRIGHTWARDS ARROWsk. Several setup options are explored in order to identify the best possible configuration.
Název v anglickém jazyce
Improving SMT by Using Parallel Data of a Closely Related Language
Popis výsledku anglicky
The amount of training data in statistical machine translation is critical for translation quality. In this paper, we demonstrate how to increase translation quality for one language pair by bringing in parallel data from a closely related language. In particular, we improve enRIGHTWARDS ARROWsk translation using a large Czech-English parallel corpus and a shallow (rule-based) MT system for csRIGHTWARDS ARROWsk. Several setup options are explored in order to identify the best possible configuration.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Human Language Technologies - The Baltic Perspective - Proceedings of the Fifth International Conference Baltic HLT 2012
ISBN
978-1-61499-132-8
ISSN
—
e-ISSN
—
Počet stran výsledku
8
Strana od-do
58-65
Název nakladatele
IOS Press
Místo vydání
Amsterdam, Netherlands
Místo konání akce
Tartu, Estonia
Datum konání akce
4. 10. 2012
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—