Towards an Indonesian-English SMT System: A Case Study of an Under-Studied and Under-Resourced Language, Indonesian
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F12%3A10130075" target="_blank" >RIV/00216208:11320/12:10130075 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.mff.cuni.cz/veda/konference/wds/proc/pdf12/WDS12_121_i3_Larasati.pdf" target="_blank" >http://www.mff.cuni.cz/veda/konference/wds/proc/pdf12/WDS12_121_i3_Larasati.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Towards an Indonesian-English SMT System: A Case Study of an Under-Studied and Under-Resourced Language, Indonesian
Popis výsledku v původním jazyce
This paper describes a work on preparing an Indonesian-English Statistical Machine Translation (SMT) System. It includes the creation of Indonesian morphological analyzer, MorphInd, and the composing of an Indonesian-English parallel corpus, IDENTIC. Webuild an SMT system using the state-of-the-art phrase-based SMT system, MOSES. We show several scenarios where the morphological tool is used to incorporate morphological information in the SMT system trained with the composed parallel corpus.
Název v anglickém jazyce
Towards an Indonesian-English SMT System: A Case Study of an Under-Studied and Under-Resourced Language, Indonesian
Popis výsledku anglicky
This paper describes a work on preparing an Indonesian-English Statistical Machine Translation (SMT) System. It includes the creation of Indonesian morphological analyzer, MorphInd, and the composing of an Indonesian-English parallel corpus, IDENTIC. Webuild an SMT system using the state-of-the-art phrase-based SMT system, MOSES. We show several scenarios where the morphological tool is used to incorporate morphological information in the SMT system trained with the composed parallel corpus.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
WDS'12 Proceedings of Contributed Papers
ISBN
978-80-7378-224-5
ISSN
—
e-ISSN
—
Počet stran výsledku
7
Strana od-do
123-129
Název nakladatele
Matfyzpress
Místo vydání
Praha, Czechia
Místo konání akce
Praha, Czechia
Datum konání akce
29. 5. 2012
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—