Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F10%3A10071521" target="_blank" >RIV/00216208:11210/10:10071521 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Korpus LINK

  • Popis výsledku v původním jazyce

    LINK (původně LIngvistův Narozeniový Korpus, který byl vytvořen u příležitosti životního jubilea prof. Františka Čermáka) je korpus sestavený pouze z lingvistických textů. Jako takový je určen zejména pro výzkum specifik akademického jazyka (výzkum terminologie, jazyk lingvistiky apod.). Korpus obsahuje celkem 2 353 748 pozic, po odečtení interpunkce se tedy jedná o cca 1,8 mil. textových slov. Korpus je lemmatizován a morfologicky označkován stejně jako jsou korpusy řady SYN, lemmatizace a značkování je zhruba na úrovni SYN2009PUB. Korpus LINK je sestaven z 258 odborných lingvistických textů z období let 1985 - 2010, velká většina textů je však z přelomu tisíciletí. Korpus je tvořen jak většími lingvistickými pracemi (monografie, sborníky), tak článkyv odborných časopisech (zejm. Slovo a slovesnost, Naše řeč).

  • Název v anglickém jazyce

    Corpus LINK

  • Popis výsledku anglicky

    LINK (originally LIngvistův Narozeninový Korpus, i.e. Linguist's Birthday Corpus, created on the occasion of Professor František Čermák's birthday) is a corpus comprising exclusively linguistic texts. It is thus designed especially for the research of academic language specifics (study of terminology, the language of linguistics etc.). The corpus contains 2 353 748 positions in total, that is approximately 1.8 million tokens (without punctuation). The corpus is lemmatized and morphologically tagged in the same way as the corpora of the SYN series (lemmatization and tagging are more or less of the same level as the SYN2009PUB corpus). The LINK corpus consists of 258 linguistics texts from the period 1985 - 2010, vast majority of which comes from the turn of the millennium. The corpus includes both major linguistic studies (monographs, proceedings) and articles in professional periodicals and journals (esp. Slovo a slovesnost, Naše řeč).

Klasifikace

  • Druh

    O - Ostatní výsledky

  • CEP obor

    AI - Jazykověda

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    Z - Vyzkumny zamer (s odkazem do CEZ)

Ostatní

  • Rok uplatnění

    2010

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů