Beyond Projectivity: Multilingual Evaluation of Constraints and Measures on Non-Projective Structures
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F07%3A00101507" target="_blank" >RIV/00216208:11320/07:00101507 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Beyond Projectivity: Multilingual Evaluation of Constraints and Measures on Non-Projective Structures
Original language description
Dependency analysis of natural language has gained importance for its applicability in tasks of NLP. Non-projective structures are common in dependency analysis, therefore we need fine-grained means of describing them, especially for the purposes of machine-learning oriented approaches like parsing. We present an evaluation on twelve languages which explores several constraints and measures on non-projective structures. We pursue an edge-based approach concentrating on properties of individual edges asopposed to properties of whole trees. In our evaluation, we include previously unreported measures taking into account levels of nodes in dependency trees. Our empirical results corroborate theoretical results and show that an edge-based approach using levels of nodes provides an accurate and at the same time expressive means for capturing non-projective structures in natural language.
Czech name
Za projektivitou: mnohojazyčné vyhodnocení omezení a měr na neprojektivních strukturách
Czech description
Závislostní analýza přirozeného jazyka získává na důležitosti díky své aplikovatelnosti v mnoha úlohách NLP. Mnohé ze vznikajících závislostních struktur jsou neprojektivní, vzniká tedy potřeba umět je podrobně popsat, zejména pro potřeby přístupů využívajících strojové učení, jako je např. parsing. Pomocí dat z dvanácti přirozených jazyků vyhodnocujeme několik omezení a měr na neprojektivních strukturách. Využíváme přitom přístupu založeného na vlastnostech jednotlivých hran oproti vlastnostem celých závislostních stromů. Ve svém vyhodnocení uvádíme dosud neprezentované míry neprojektivity, které v sobě zahrnují hladiny uzlů v závislostních stromech. Empirické výsledky podporují výsledky teoretické a prokazují, že přístup založený na vlastnostech hranvyužívající hladin uzlů poskytuje přesné a silné prostředky pro zachycení neprojektivních struktur v přirozených jazycích.
Classification
Type
D - Article in proceedings
CEP classification
AI - Linguistics
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/1ET201120505" target="_blank" >1ET201120505: From a Natural Language to Knowledge and the Semantic Web</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2007
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
ACL 2008 Proceedings of the 46th Annual Meeting of the Association of Computational Linguistics: Human Language Technologies
ISBN
978-1-932432-06-0
ISSN
—
e-ISSN
—
Number of pages
8
Pages from-to
—
Publisher name
Association for Computational Linguistics
Place of publication
—
Event location
Neuveden
Event date
Jan 1, 2007
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—