A System for Syntactic Annotation of Large Czech Corpora
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F13%3A10188942" target="_blank" >RIV/00216208:11210/13:10188942 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
A System for Syntactic Annotation of Large Czech Corpora
Popis výsledku v původním jazyce
We present a system of pre-processing and post-processing of linguistic data leading to an improvement of stochastic dependency parsing results. We (( condense }} the data for the stochastic parser, i.e. we reduce the variability of word lemmas and formsin the text. After the parsing is done, we correct some of the recurrent parsing errors with a rule-based correction system. We achieve a 10,8% relative error reduction.
Název v anglickém jazyce
A System for Syntactic Annotation of Large Czech Corpora
Popis výsledku anglicky
We present a system of pre-processing and post-processing of linguistic data leading to an improvement of stochastic dependency parsing results. We (( condense }} the data for the stochastic parser, i.e. we reduce the variability of word lemmas and formsin the text. After the parsing is done, we correct some of the recurrent parsing errors with a rule-based correction system. We achieve a 10,8% relative error reduction.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů