GramatiKat
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F21%3A10436221" target="_blank" >RIV/00216208:11210/21:10436221 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.korpus.cz/gramatikat/" target="_blank" >https://www.korpus.cz/gramatikat/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
GramatiKat
Popis výsledku v původním jazyce
GramatiKat poskytuje informace o hodnotách gramatických kategorií v rámci vybraného slovního druhu (např. který pád se u substantiv používá nejvíce a který nejméně apod.) i pro jednotlivá lemmata (vytváření gramatických profilů). Nástroj je určen primárně k výzkumu gramatických kategorií a také k lexikologickému a lexikografickému zkoumání, ale najde své uplatnění např. i při výuce češtiny. V současné chvíli jsou k dispozici informace o českých substantivech, do budoucna počítáme i se zpracováním adjektiv a sloves. Všechna data jsou přebírána z korpusů ČNK, konkrétně z korpusů SYN2015 a ORALv4. Pracujeme pouze se substantivy, která se v daném korpusu vyskytnou alespoň 100krát. Procentuální rozložení jednotlivých tvarů je založeno na rozložení tvarů v jednotlivých lemmatech - každé lemma má tedy při výpočtech stejnou váhu, bez ohledu na frekvenci. Tím zajistíme, aby extrémně frekventovaná lemmata nezkreslovala celkové výsledky.
Název v anglickém jazyce
GramatiKat
Popis výsledku anglicky
GramatiKat provides information on the grammatical categories within a part of speech (e.g. which case is used most frequently for nouns etc.) as well as for individual lemmas (grammatical profiles). The tool is designed primarily for research into grammatical categories as well as for lexicological and lexicographic exploration, but it can be useful for other purposes, e.g. teaching Czech as a second language. At the moment, only information on Czech nouns is available, we plan for adding adjectives and verbs in the future. Data is from the Czech National Corpus, namely the SYN2015 and ORALv4 corpora. We only take into account nouns with frequency 100 and higher. The summary of word form distribution within a part of speech is based on the distribution of the word forms of each lemma (each lemma has equal weight in the calculations, regardless of frequency). This ensures that extremely frequented lemmas do not distort the overall results.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
GramatiKat
Technické parametry
2021
Ekonomické parametry
ne
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova