Konzistence morfologického slovníku MorfFlex
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F21%3A10456869" target="_blank" >RIV/00216208:11320/21:10456869 - isvavai.cz</a>
Výsledek na webu
<a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=2BjqLhNlrh" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=2BjqLhNlrh</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Konzistence morfologického slovníku MorfFlex
Popis výsledku v původním jazyce
Jazykové korpusy obvykle obsahují kromě vlastních textů i různé typy anotací. Nejběžnější je morfologická anotace, která spočívá v přiřazení lemmatu a morfologického tagu každému slovnímu tvaru. Pro morfologické značkování se tradičně používají morfologické slovníky. Náš příspěvek představuje novou verzi tzv. "pražského" morfologického slovníku MorfFlex používaného pro tagování mnoha českých korpusů (zejména Prague Dependency Treebanks, korpusy vydávané Ústavem českého národního korpusu v Praze nebo velké české webové korpusy řady Aranea ). K aktualizaci slovníku byly použity tři základní principy: Zlaté pravidlo morfologie, Princip jednoty paradigmatu a Princip jedinečnosti paradigmatu.
Název v anglickém jazyce
Consistency of the MorfFlex morphological dictionary
Popis výsledku anglicky
Language corpora usually contain, in addition to their own texts, various types of annotations. The most common one is a morphological annotation, which consists in assigning a lemma and a morphological tag to each wordform. For morphological tagging, morphological dictionaries are traditionally used. Our paper presents a new version of the so-called "Prague" morphological dictionary MorfFlex used for tagging many Czech corpora (particularly Prague Dependency Treebanks, corpora published by the Institute of the Czech National Corpus in Prague or large Czech web corpora of the Aranea series). Three basic principles were used to update the dictionary: the Golden Rule of Morphology, the Principle of Paradigm Unity, and the Principle of Paradigm Uniqueness.
Klasifikace
Druh
J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2018101" target="_blank" >LM2018101: Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Jazykovedný Časopis
ISSN
0021-5597
e-ISSN
1338-4287
Svazek periodika
72
Číslo periodika v rámci svazku
4
Stát vydavatele periodika
SK - Slovenská republika
Počet stran výsledku
7
Strana od-do
855-861
Kód UT WoS článku
—
EID výsledku v databázi Scopus
2-s2.0-85138610519