Stop-probability estimates computed on a large corpus improve Unsupervised Dependency Parsing
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F13%3A10194659" target="_blank" >RIV/00216208:11320/13:10194659 - isvavai.cz</a>
Výsledek na webu
<a href="http://aclweb.org/anthology/P/P13/P13-1028.pdf" target="_blank" >http://aclweb.org/anthology/P/P13/P13-1028.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Stop-probability estimates computed on a large corpus improve Unsupervised Dependency Parsing
Popis výsledku v původním jazyce
Even though the quality of unsupervised dependency parsers grows, they often fail in recognition of very basic dependencies. In this paper, we exploit a prior knowledge of STOP-probabilities (whether a given word has any children in a given direction), which is obtained from a large raw corpus using the reducibility principle. By incorporating this knowledge into Dependency Model with Valence, we managed to considerably outperform the state-of-the-art results in terms of average attachment score over 20treebanks from CoNLL 2006 and 2007 shared tasks.
Název v anglickém jazyce
Stop-probability estimates computed on a large corpus improve Unsupervised Dependency Parsing
Popis výsledku anglicky
Even though the quality of unsupervised dependency parsers grows, they often fail in recognition of very basic dependencies. In this paper, we exploit a prior knowledge of STOP-probabilities (whether a given word has any children in a given direction), which is obtained from a large raw corpus using the reducibility principle. By incorporating this knowledge into Dependency Model with Valence, we managed to considerably outperform the state-of-the-art results in terms of average attachment score over 20treebanks from CoNLL 2006 and 2007 shared tasks.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/DF12P01OVV022" target="_blank" >DF12P01OVV022: Zpřístupnění rozsáhlého video archivu kulturního dědictví pomocí metod automatického rozpoznávání mluvené řeči a strojového překladu. (AMALACH)</a><br>
Návaznosti
V - Vyzkumna aktivita podporovana z jinych verejnych zdroju
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics
ISBN
978-1-937284-50-3
ISSN
—
e-ISSN
—
Počet stran výsledku
10
Strana od-do
281-290
Název nakladatele
Association for Computational Linguistics
Místo vydání
Sofija, Bulgaria
Místo konání akce
Sofija, Bulgaria
Datum konání akce
4. 8. 2013
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—