Korpus LINK
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F10%3A10071521" target="_blank" >RIV/00216208:11210/10:10071521 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Korpus LINK
Popis výsledku v původním jazyce
LINK (původně LIngvistův Narozeniový Korpus, který byl vytvořen u příležitosti životního jubilea prof. Františka Čermáka) je korpus sestavený pouze z lingvistických textů. Jako takový je určen zejména pro výzkum specifik akademického jazyka (výzkum terminologie, jazyk lingvistiky apod.). Korpus obsahuje celkem 2 353 748 pozic, po odečtení interpunkce se tedy jedná o cca 1,8 mil. textových slov. Korpus je lemmatizován a morfologicky označkován stejně jako jsou korpusy řady SYN, lemmatizace a značkování je zhruba na úrovni SYN2009PUB. Korpus LINK je sestaven z 258 odborných lingvistických textů z období let 1985 - 2010, velká většina textů je však z přelomu tisíciletí. Korpus je tvořen jak většími lingvistickými pracemi (monografie, sborníky), tak článkyv odborných časopisech (zejm. Slovo a slovesnost, Naše řeč).
Název v anglickém jazyce
Corpus LINK
Popis výsledku anglicky
LINK (originally LIngvistův Narozeninový Korpus, i.e. Linguist's Birthday Corpus, created on the occasion of Professor František Čermák's birthday) is a corpus comprising exclusively linguistic texts. It is thus designed especially for the research of academic language specifics (study of terminology, the language of linguistics etc.). The corpus contains 2 353 748 positions in total, that is approximately 1.8 million tokens (without punctuation). The corpus is lemmatized and morphologically tagged in the same way as the corpora of the SYN series (lemmatization and tagging are more or less of the same level as the SYN2009PUB corpus). The LINK corpus consists of 258 linguistics texts from the period 1985 - 2010, vast majority of which comes from the turn of the millennium. The corpus includes both major linguistic studies (monographs, proceedings) and articles in professional periodicals and journals (esp. Slovo a slovesnost, Naše řeč).
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2010
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů