Dealing with Function Words in Unsupervised Dependency Parsing
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F14%3A10289392" target="_blank" >RIV/00216208:11320/14:10289392 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Dealing with Function Words in Unsupervised Dependency Parsing
Popis výsledku v původním jazyce
In this paper, we show some properties of function words in dependency trees. Function words are grammatical words, such as articles, prepositions, pronouns, conjunctions, or auxiliary verbs. These words are often short and very frequent in texts and therefore many of them can be easily recognized. We formulate a hypothesis that function words tend to have a fixed number of dependents and we prove this hypothesis on treebanks. Using this hypothesis, we are able to improve unsupervised dependency parsingand outperform previously published state-of-the-art results for many languages.
Název v anglickém jazyce
Dealing with Function Words in Unsupervised Dependency Parsing
Popis výsledku anglicky
In this paper, we show some properties of function words in dependency trees. Function words are grammatical words, such as articles, prepositions, pronouns, conjunctions, or auxiliary verbs. These words are often short and very frequent in texts and therefore many of them can be easily recognized. We formulate a hypothesis that function words tend to have a fixed number of dependents and we prove this hypothesis on treebanks. Using this hypothesis, we are able to improve unsupervised dependency parsingand outperform previously published state-of-the-art results for many languages.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GP14-06548P" target="_blank" >GP14-06548P: Odvození větné struktury bez anotovaných korpusů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
15th International Conference on Computational Linguistics and Intelligent Text Processing
ISBN
978-3-642-54905-2
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
12
Strana od-do
250-261
Název nakladatele
Springer
Místo vydání
Berlin / Heidelberg
Místo konání akce
Kathmandu, Nepal
Datum konání akce
6. 4. 2014
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—