Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Sketch Engine: Czech Drama Corpus (v1)

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989592%3A15210%2F24%3A73630321" target="_blank" >RIV/61989592:15210/24:73630321 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Sketch Engine: Czech Drama Corpus (v1)

  • Popis výsledku v původním jazyce

    Specializovaná korpusová databáze českých divadelních her, vytvořená v rámci projektu DraCor (http://dracor.org/). Tato první verze korpusu obsahuje všech 10 her bratří Čapků a data byla zpracována dat s ohledem na jejich specifickou mnohovrstevnatou strukturu. Pro potřeby nástroje SketchEngine byl korpus dodatečně jazykově anotován (lemmatizace, morfologické značkování). Data jsou zpracována ve standardizovaném formátu založeném na XML a obecných směrnicích TEI, součástí jsou metadata jako autor, název nebo rok vydání. Tento korpus slouží jako cenný zdroj pro všechny lingvisty, kteří se zajímají o jazyk dramat.

  • Název v anglickém jazyce

    Sketch Engine: Czech Drama Corpus (v1)

  • Popis výsledku anglicky

    Specialized corpus database of Czech theatre plays, created within the DraCor project (http://dracor.org/). This first version of the corpus contains all 10 plays by the Čapek brothers and the data has been processed taking into account their specific multi-layered structure. Within the SketchEngine tool, the corpus has been additionally linguistically annotated (lemmatization, morphological tagging). The data is processed in a standardized format based on XML and TEI guidelines, including metadata such as author, title or year of publication. This corpus serves as a valuable resource for all linguists interested in the language of drama.

Klasifikace

  • Druh

    O - Ostatní výsledky

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

  • Návaznosti

    I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

  • Rok uplatnění

    2024

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů