Robust Multilingual Statistical Morphological Generation Models
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F13%3A10194629" target="_blank" >RIV/00216208:11320/13:10194629 - isvavai.cz</a>
Výsledek na webu
<a href="http://aclweb.org/anthology/P/P13/P13-3023.pdf" target="_blank" >http://aclweb.org/anthology/P/P13/P13-3023.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Robust Multilingual Statistical Morphological Generation Models
Popis výsledku v původním jazyce
We present a novel method of statistical morphological generation, i.e. the prediction of inflected word forms given lemma, part-of-peech and morphological features, aimed at robustness to unseen inputs. Our system uses a trainable classifier to predict"edit scripts" that are then used to transform lemmas into inflected word forms. Suffixes of lemmas are included as features to achieve robustness. We evaluate our system on 6 languages with a varying degree of morphological richness. The results show that the system is able to learn most morphological phenomena and generalize to unseen inputs, producing significantly better results than a dictionary-based baseline.
Název v anglickém jazyce
Robust Multilingual Statistical Morphological Generation Models
Popis výsledku anglicky
We present a novel method of statistical morphological generation, i.e. the prediction of inflected word forms given lemma, part-of-peech and morphological features, aimed at robustness to unseen inputs. Our system uses a trainable classifier to predict"edit scripts" that are then used to transform lemmas into inflected word forms. Suffixes of lemmas are included as features to achieve robustness. We evaluate our system on 6 languages with a varying degree of morphological richness. The results show that the system is able to learn most morphological phenomena and generalize to unseen inputs, producing significantly better results than a dictionary-based baseline.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LK11221" target="_blank" >LK11221: Vývoj metod pro návrh statistických mluvených dialogových systémů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
51st Annual Meeting of the Association for Computational Linguistics Proceedings of the Student Research Workshop
ISBN
978-1-937284-53-4
ISSN
—
e-ISSN
—
Počet stran výsledku
7
Strana od-do
158-164
Název nakladatele
Association for Computational Linguistics
Místo vydání
Sofija, Bulgaria
Místo konání akce
Sofija, Bulgaria
Datum konání akce
5. 8. 2013
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—