Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F21%3A10436221" target="_blank" >RIV/00216208:11210/21:10436221 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://www.korpus.cz/gramatikat/" target="_blank" >https://www.korpus.cz/gramatikat/</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    GramatiKat

  • Popis výsledku v původním jazyce

    GramatiKat poskytuje informace o hodnotách gramatických kategorií v rámci vybraného slovního druhu (např. který pád se u substantiv používá nejvíce a který nejméně apod.) i pro jednotlivá lemmata (vytváření gramatických profilů). Nástroj je určen primárně k výzkumu gramatických kategorií a také k lexikologickému a lexikografickému zkoumání, ale najde své uplatnění např. i při výuce češtiny. V současné chvíli jsou k dispozici informace o českých substantivech, do budoucna počítáme i se zpracováním adjektiv a sloves. Všechna data jsou přebírána z korpusů ČNK, konkrétně z korpusů SYN2015 a ORALv4. Pracujeme pouze se substantivy, která se v daném korpusu vyskytnou alespoň 100krát. Procentuální rozložení jednotlivých tvarů je založeno na rozložení tvarů v jednotlivých lemmatech - každé lemma má tedy při výpočtech stejnou váhu, bez ohledu na frekvenci. Tím zajistíme, aby extrémně frekventovaná lemmata nezkreslovala celkové výsledky.

  • Název v anglickém jazyce

    GramatiKat

  • Popis výsledku anglicky

    GramatiKat provides information on the grammatical categories within a part of speech (e.g. which case is used most frequently for nouns etc.) as well as for individual lemmas (grammatical profiles). The tool is designed primarily for research into grammatical categories as well as for lexicological and lexicographic exploration, but it can be useful for other purposes, e.g. teaching Czech as a second language. At the moment, only information on Czech nouns is available, we plan for adding adjectives and verbs in the future. Data is from the Czech National Corpus, namely the SYN2015 and ORALv4 corpora. We only take into account nouns with frequency 100 and higher. The summary of word form distribution within a part of speech is based on the distribution of the word forms of each lemma (each lemma has equal weight in the calculations, regardless of frequency). This ensures that extremely frequented lemmas do not distort the overall results.

Klasifikace

  • Druh

    R - Software

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2021

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    GramatiKat

  • Technické parametry

    2021

  • Ekonomické parametry

    ne

  • IČO vlastníka výsledku

    00216208

  • Název vlastníka

    Univerzita Karlova