Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Staročeská a středněčeská textová banka 1.1.10.1

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68378092%3A_____%2F19%3A00521743" target="_blank" >RIV/68378092:_____/19:00521743 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://korpus.vokabular.ujc.cas.cz/first_form?corpname=SSTB-1.1.10.1" target="_blank" >https://korpus.vokabular.ujc.cas.cz/first_form?corpname=SSTB-1.1.10.1</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Staročeská a středněčeská textová banka 1.1.10.1

  • Popis výsledku v původním jazyce

    Kolekce transkribovaných textů staročeských a středněčeských literárních památek z období přibližně mezi lety 1300 až 1800 s částečnou (hyper)lemmatizací a morfologickým značkováním bez disambiguace. Změny proti předchozí verzi: nevyvážený korpus obsahuje 307 pramenů, celkem 6 377 346 pozic, lemmata jsou přiřazena asi 62 % tokenů, část pramenů byly formálně a věcně opravena, vylepšená tokenizace, doplněno morfologické značkování forem slovesa „býti“.

  • Název v anglickém jazyce

    Old Czech and Middle Czech Text Bank 1.1.10.1

  • Popis výsledku anglicky

    A collection of transcribed historical Old Czech and Middle Czech texts from the period of ca. 1300–1800 with partial (hyper-)lemmatisation and morphological tagging without disambiguation. Changes from the previous version: the unbalanced corpus contains 307 historical sources and a total of 6,377,346 position, 62% of the tokens are matched with lemmas, some of the historical texts were corrected formally and factually, tokenisation was improved, morphological tags were added for the verb “býti” (to be) and its forms.

Klasifikace

  • Druh

    S<sub>db</sub> - Specializovaná veřejná databáze

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2015081" target="_blank" >LM2015081: Výzkumná infrastruktura pro diachronní bohemistiku</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2019

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Číslo předpisu

    LM2015081/SSTB_v1.1.10.1

  • Označení certifikačního orgánu

    Ministerstvo školství, mládeže a tělovýchovy České republiky, Karmelitská 529/5, 118 00 Praha 1

  • Datum certifikace