Systém pro syntaktické značkování velkých korpusů
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F11%3A10104213" target="_blank" >RIV/00216208:11210/11:10104213 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Systém pro syntaktické značkování velkých korpusů
Popis výsledku v původním jazyce
Článek představuje systém pro syntaktickou anotaci rozsáhlých textových korpusů: využití stochastického závislostního parseru, jehož výsledky koriguje pro tyto účely vyvinutý opravný modul založený na lingvistických pravidlech. Využití tohoto systému jeprezentováno na údajích o vztahu formy a funkce u substantiv: vztah syntaktických funkcí substantiv a jejich pádu (prostého či předložkového). Údaje byly získány z korpusu SYN2005, s automaticky doplněným závislostním značkováním.
Název v anglickém jazyce
System for yntactic annotation of large corpora
Popis výsledku anglicky
Syntactic annotation of corpora is a useful corpus exploitation tool, presently limited to small corpora. The purpose of our project, entitled Syntactic Annotation of Czech Corpora, is to provide a large syntactically annotated corpus with customizable representation. In this paper, I present the methods used for automatic syntactic annotation: a stochastic parser followed by a rule-based automatic correction module. The usefulness of such an annotation is demonstrated on frequency tables of syntactic functions of Czech nouns with respect to their case and preposition, which were extracted from the SYN2005 corpus, with additional syntactic annotation.
Klasifikace
Druh
C - Kapitola v odborné knize
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2011
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název knihy nebo sborníku
Korpusová lingvistika Praha 2011. 3 Gramatika a značkování korpusů
ISBN
978-80-7422-116-3
Počet stran výsledku
20
Strana od-do
123-142
Počet stran knihy
225
Název nakladatele
Nakladatelství Lidové noviny
Místo vydání
Praha
Kód UT WoS kapitoly
—