Improvements to Dependency Parsing Using Automatic Simplification of Data
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F14%3A10289998" target="_blank" >RIV/00216208:11210/14:10289998 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.lrec-conf.org/proceedings/lrec2014/pdf/228_Paper.pdf" target="_blank" >http://www.lrec-conf.org/proceedings/lrec2014/pdf/228_Paper.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Improvements to Dependency Parsing Using Automatic Simplification of Data
Popis výsledku v původním jazyce
The paper presents a method of improving dependency parsing using automatic simplification of data. Language data are often too complex (and too sparse) for parsers to cope with. The paper shows that by means of small, reversible simplifications of the text and of the annotation, a considerable improvement of parsing accuracy can be achieved. In order to facilitate the task of language modeling performed by the parser, I reduce variability of lemmas and word forms in the text. I modify the system of morphological annotation to make it more suitable for parsing. Finally, the dependency annotation scheme is also partially modified. All such modifications are automatic and fully reversible: after the parsing is done, the original data and structures are automatically restored. With MaltParser, I achieve an 8.3% error rate reduction.
Název v anglickém jazyce
Improvements to Dependency Parsing Using Automatic Simplification of Data
Popis výsledku anglicky
The paper presents a method of improving dependency parsing using automatic simplification of data. Language data are often too complex (and too sparse) for parsers to cope with. The paper shows that by means of small, reversible simplifications of the text and of the annotation, a considerable improvement of parsing accuracy can be achieved. In order to facilitate the task of language modeling performed by the parser, I reduce variability of lemmas and word forms in the text. I modify the system of morphological annotation to make it more suitable for parsing. Finally, the dependency annotation scheme is also partially modified. All such modifications are automatic and fully reversible: after the parsing is done, the original data and structures are automatically restored. With MaltParser, I achieve an 8.3% error rate reduction.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA13-27184S" target="_blank" >GA13-27184S: Treebank češtiny na základě gramatiky</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)
ISBN
978-2-9517408-8-4
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
73-77
Název nakladatele
European Language Resources Association (ELRA)
Místo vydání
Reykjavík, Island
Místo konání akce
Reykjavík, Island
Datum konání akce
26. 5. 2014
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—