Kvantitativní určení lexikálního jádra jazyka
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F14%3A10286215" target="_blank" >RIV/00216208:11210/14:10286215 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Kvantitativní určení lexikálního jádra jazyka
Popis výsledku v původním jazyce
Využití tzv. hapax legomenon, tj. jazykových jednotek, které se v korpusu vyskytují právě jednou, je v lingvistickém popisu povětšinou (a nutno dodat, že právem) přehlíženo. Důvodem je fakt, že izolovaná evidence neposkytuje rámec pro jakýkoli typ zobecnění. Příspěvek se věnuje možnostem využití informace o počtu hapax legomenon k celkové velikosti textu nebo korpusu pro empirické vymezení jaderného lexikonu.
Název v anglickém jazyce
Quantitative delimitation of a core lexicon
Popis výsledku anglicky
The exploitation of hapax legomena, i.e. word or lemma types which occur in a corpus only once, in language description is usually overlooked. These types cannot be systematically used for vast majority of analyses as they do not provide a base for any type of generalization. On the other hand, the overall number of hapaxes can be used as an indicator of lexical periphery of the language system. This paper suggests that ratio between number of hapaxes and number of all types in relation to the growing corpus size (hapax-type ratio, HTR) can be used for delimitation of lexical core of a language. It has been shown by previous research (Fengxiang 2010) that HTR in English has a shape of a pipe or chibouque, which means that the pace of emerging new hapaxes and new types in a process of building a corpus differ before and after reaching certain size. In a hypothetically small corpus (a few sentences) the hapax-type ratio will be equal to one (each word-type is also a hapax). As we add tex
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Časopis pro moderní filologii
ISSN
0008-7386
e-ISSN
—
Svazek periodika
96
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
17
Strana od-do
9-26
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—