GramatiKat

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F21%3A10436221" target="_blank" >RIV/00216208:11210/21:10436221 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.korpus.cz/gramatikat/" target="_blank" >https://www.korpus.cz/gramatikat/</a>
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
GramatiKat
Popis výsledku v původním jazyce
GramatiKat poskytuje informace o hodnotách gramatických kategorií v rámci vybraného slovního druhu (např. který pád se u substantiv používá nejvíce a který nejméně apod.) i pro jednotlivá lemmata (vytváření gramatických profilů). Nástroj je určen primárně k výzkumu gramatických kategorií a také k lexikologickému a lexikografickému zkoumání, ale najde své uplatnění např. i při výuce češtiny. V současné chvíli jsou k dispozici informace o českých substantivech, do budoucna počítáme i se zpracováním adjektiv a sloves. Všechna data jsou přebírána z korpusů ČNK, konkrétně z korpusů SYN2015 a ORALv4. Pracujeme pouze se substantivy, která se v daném korpusu vyskytnou alespoň 100krát. Procentuální rozložení jednotlivých tvarů je založeno na rozložení tvarů v jednotlivých lemmatech - každé lemma má tedy při výpočtech stejnou váhu, bez ohledu na frekvenci. Tím zajistíme, aby extrémně frekventovaná lemmata nezkreslovala celkové výsledky.
Název v anglickém jazyce
GramatiKat
Popis výsledku anglicky
GramatiKat provides information on the grammatical categories within a part of speech (e.g. which case is used most frequently for nouns etc.) as well as for individual lemmas (grammatical profiles). The tool is designed primarily for research into grammatical categories as well as for lexicological and lexicographic exploration, but it can be useful for other purposes, e.g. teaching Czech as a second language. At the moment, only information on Czech nouns is available, we plan for adding adjectives and verbs in the future. Data is from the Czech National Corpus, namely the SYN2015 and ORALv4 corpora. We only take into account nouns with frequency 100 and higher. The summary of word form distribution within a part of speech is based on the distribution of the word forms of each lemma (each lemma has equal weight in the calculations, regardless of frequency). This ensures that extremely frequented lemmas do not distort the overall results.

Klasifikace

Druh
R - Software
CEP obor
—
OECD FORD obor
60203 - Linguistics

Návaznosti výsledku

Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Interní identifikační kód produktu
GramatiKat
Technické parametry
2021
Ekonomické parametry
ne
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova

Podobné výsledky(10)

GramatiKat (verze 2) : Nástroj pro výzkum gramatických kategorií a gramatické profily The structuralist tradition meets empirical data: Corpus data enhancing the Czech Internet Language Reference Book Staročeské slovní tvary, verze 2019.12.10

Co hledáte?

Rychlé hledání

Chytré vyhledávání

GramatiKat

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)