A System for Syntactic Annotation of Large Czech Corpora

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F13%3A10188942" target="_blank" >RIV/00216208:11210/13:10188942 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Jazyk výsledku
angličtina
Název v původním jazyce
A System for Syntactic Annotation of Large Czech Corpora
Popis výsledku v původním jazyce
We present a system of pre-processing and post-processing of linguistic data leading to an improvement of stochastic dependency parsing results. We (( condense }} the data for the stochastic parser, i.e. we reduce the variability of word lemmas and formsin the text. After the parsing is done, we correct some of the recurrent parsing errors with a rule-based correction system. We achieve a 10,8% relative error reduction.
Název v anglickém jazyce
A System for Syntactic Annotation of Large Czech Corpora
Popis výsledku anglicky
We present a system of pre-processing and post-processing of linguistic data leading to an improvement of stochastic dependency parsing results. We (( condense }} the data for the stochastic parser, i.e. we reduce the variability of word lemmas and formsin the text. After the parsing is done, we correct some of the recurrent parsing errors with a rule-based correction system. We achieve a 10,8% relative error reduction.

Projekt
<a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Podobné výsledky(10)