Gibbs Sampling Segmentation of Parallel Dependency Trees for Tree-Based Machine Translation
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F16%3A10335396" target="_blank" >RIV/00216208:11320/16:10335396 - isvavai.cz</a>
Výsledek na webu
<a href="https://ufal.mff.cuni.cz/pbml/105/art-marecek-zabokrtsky.pdf" target="_blank" >https://ufal.mff.cuni.cz/pbml/105/art-marecek-zabokrtsky.pdf</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1515/pralin-2016-0005" target="_blank" >10.1515/pralin-2016-0005</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Gibbs Sampling Segmentation of Parallel Dependency Trees for Tree-Based Machine Translation
Popis výsledku v původním jazyce
We present a work in progress aimed at extracting translation pairs of source and target dependency treelets to be used in a dependency-based machine translation system. We introduce a novel unsupervised method for parallel tree segmentation based on Gibbs sampling. Using the data from a Czech-English parallel treebank, we show that the procedure converges to a dictionary containing reasonably sized treelets; in some cases, the segmentation seems to have interesting linguistic interpretations.
Název v anglickém jazyce
Gibbs Sampling Segmentation of Parallel Dependency Trees for Tree-Based Machine Translation
Popis výsledku anglicky
We present a work in progress aimed at extracting translation pairs of source and target dependency treelets to be used in a dependency-based machine translation system. We introduce a novel unsupervised method for parallel tree segmentation based on Gibbs sampling. Using the data from a Czech-English parallel treebank, we show that the procedure converges to a dictionary containing reasonably sized treelets; in some cases, the segmentation seems to have interesting linguistic interpretations.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GP14-06548P" target="_blank" >GP14-06548P: Odvození větné struktury bez anotovaných korpusů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
The Prague Bulletin of Mathematical Linguistics
ISSN
0032-6585
e-ISSN
—
Svazek periodika
105
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
10
Strana od-do
101-110
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—