Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Systém pro syntaktické značkování velkých korpusů

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F11%3A10104213" target="_blank" >RIV/00216208:11210/11:10104213 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Systém pro syntaktické značkování velkých korpusů

  • Popis výsledku v původním jazyce

    Článek představuje systém pro syntaktickou anotaci rozsáhlých textových korpusů: využití stochastického závislostního parseru, jehož výsledky koriguje pro tyto účely vyvinutý opravný modul založený na lingvistických pravidlech. Využití tohoto systému jeprezentováno na údajích o vztahu formy a funkce u substantiv: vztah syntaktických funkcí substantiv a jejich pádu (prostého či předložkového). Údaje byly získány z korpusu SYN2005, s automaticky doplněným závislostním značkováním.

  • Název v anglickém jazyce

    System for yntactic annotation of large corpora

  • Popis výsledku anglicky

    Syntactic annotation of corpora is a useful corpus exploitation tool, presently limited to small corpora. The purpose of our project, entitled Syntactic Annotation of Czech Corpora, is to provide a large syntactically annotated corpus with customizable representation. In this paper, I present the methods used for automatic syntactic annotation: a stochastic parser followed by a rule-based automatic correction module. The usefulness of such an annotation is demonstrated on frequency tables of syntactic functions of Czech nouns with respect to their case and preposition, which were extracted from the SYN2005 corpus, with additional syntactic annotation.

Klasifikace

  • Druh

    C - Kapitola v odborné knize

  • CEP obor

    AI - Jazykověda

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    Z - Vyzkumny zamer (s odkazem do CEZ)

Ostatní

  • Rok uplatnění

    2011

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název knihy nebo sborníku

    Korpusová lingvistika Praha 2011. 3 Gramatika a značkování korpusů

  • ISBN

    978-80-7422-116-3

  • Počet stran výsledku

    20

  • Strana od-do

    123-142

  • Počet stran knihy

    225

  • Název nakladatele

    Nakladatelství Lidové noviny

  • Místo vydání

    Praha

  • Kód UT WoS kapitoly