Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

FicTree : syntakticky anotovaný korpus české beletrie

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F17%3A10367014" target="_blank" >RIV/00216208:11210/17:10367014 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://wiki.korpus.cz/doku.php/cnk:fictree" target="_blank" >https://wiki.korpus.cz/doku.php/cnk:fictree</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    FicTree : syntakticky anotovaný korpus české beletrie

  • Popis výsledku v původním jazyce

    Závislostní korpus FicTree je syntakticky anotovaný korpus české beletrie. Obsahuje 135 000 slov (166 000 tokenů). Lematizace, morfologická a syntaktická anotace byly provedeny manuálně. Korpus je přístupný jednak jako anotovaný korpus v řadě korpusů ČNK přes rozhraní KonText, jednak jako data ke stažení, zamíchaná (kvůli autorským právům), dostupná ve standardu Pražského závislostního korpusu (a-rovina) i ve standardu Universal Dependencies.

  • Název v anglickém jazyce

    FicTree : a manually annotated treebank of Czech fiction

  • Popis výsledku anglicky

    The FicTree treebank is a syntactically annotated corpus of Czech fiction. It consists of 135,000 words (166,000 tokens). The lemmatization, the morphological and syntactic annotation were performed manually. The treebank is accessible both as an annotated corpus in the CNC KonText interface and as downloadable shuffled language data, available both in the Prague Dependency Treebank a-layer annotation standard, and in Universal Dependencies standard.

Klasifikace

  • Druh

    S<sub>db</sub> - Specializovaná veřejná databáze

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2015044" target="_blank" >LM2015044: Český národní korpus</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2017

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Číslo předpisu

    LM2015044/FicTree

  • Označení certifikačního orgánu

    Ministerstvo školství, mládeže a tělovýchovy České republiky, Karmelitská 529/5, 118 00 Praha 1

  • Datum certifikace