Sharing data through specialized corpus-based tools: the case of GramatiKat
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F21%3A10436225" target="_blank" >RIV/00216208:11210/21:10436225 - isvavai.cz</a>
Výsledek na webu
<a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=ruQdjki7yg" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=ruQdjki7yg</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.2478/jazcas-2021-0049" target="_blank" >10.2478/jazcas-2021-0049</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Sharing data through specialized corpus-based tools: the case of GramatiKat
Popis výsledku v původním jazyce
This paper presents a specialized corpus tool GramatiKat in the context of Open Science principles, namely data sharing, which offers opportunities for original research and facilitates verifiability of research and building on previous research. The tool is designed primarily for examining grammatical categories from the quantitative point of view. It offers grammatical profiles of particular lemmas (currently 14 thousand Czech nouns) and the proportion of individual grammatical categories within a part of speech, i.e. the standard behavior of the word class. The data in GramatiKat are pre-processed, statistically evaluated, and presented in charts and tables for clarity, and they are available to other linguists, especially from fields of morphology and lexicography. This article is aimed to provide inspiration and support to corpus and non-corpus linguists to utilize and enhance existing tools and to create new specialized tools available to other users.
Název v anglickém jazyce
Sharing data through specialized corpus-based tools: the case of GramatiKat
Popis výsledku anglicky
This paper presents a specialized corpus tool GramatiKat in the context of Open Science principles, namely data sharing, which offers opportunities for original research and facilitates verifiability of research and building on previous research. The tool is designed primarily for examining grammatical categories from the quantitative point of view. It offers grammatical profiles of particular lemmas (currently 14 thousand Czech nouns) and the proportion of individual grammatical categories within a part of speech, i.e. the standard behavior of the word class. The data in GramatiKat are pre-processed, statistically evaluated, and presented in charts and tables for clarity, and they are available to other linguists, especially from fields of morphology and lexicography. This article is aimed to provide inspiration and support to corpus and non-corpus linguists to utilize and enhance existing tools and to create new specialized tools available to other users.
Klasifikace
Druh
J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Jazykovedny Casopis
ISSN
0021-5597
e-ISSN
—
Svazek periodika
72
Číslo periodika v rámci svazku
2
Stát vydavatele periodika
SK - Slovenská republika
Počet stran výsledku
14
Strana od-do
531-544
Kód UT WoS článku
—
EID výsledku v databázi Scopus
2-s2.0-85123510518