Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Konzistence morfologického slovníku MorfFlex

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F21%3A10456869" target="_blank" >RIV/00216208:11320/21:10456869 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=2BjqLhNlrh" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=2BjqLhNlrh</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Konzistence morfologického slovníku MorfFlex

  • Popis výsledku v původním jazyce

    Jazykové korpusy obvykle obsahují kromě vlastních textů i různé typy anotací. Nejběžnější je morfologická anotace, která spočívá v přiřazení lemmatu a morfologického tagu každému slovnímu tvaru. Pro morfologické značkování se tradičně používají morfologické slovníky. Náš příspěvek představuje novou verzi tzv. &quot;pražského&quot; morfologického slovníku MorfFlex používaného pro tagování mnoha českých korpusů (zejména Prague Dependency Treebanks, korpusy vydávané Ústavem českého národního korpusu v Praze nebo velké české webové korpusy řady Aranea ). K aktualizaci slovníku byly použity tři základní principy: Zlaté pravidlo morfologie, Princip jednoty paradigmatu a Princip jedinečnosti paradigmatu.

  • Název v anglickém jazyce

    Consistency of the MorfFlex morphological dictionary

  • Popis výsledku anglicky

    Language corpora usually contain, in addition to their own texts, various types of annotations. The most common one is a morphological annotation, which consists in assigning a lemma and a morphological tag to each wordform. For morphological tagging, morphological dictionaries are traditionally used. Our paper presents a new version of the so-called &quot;Prague&quot; morphological dictionary MorfFlex used for tagging many Czech corpora (particularly Prague Dependency Treebanks, corpora published by the Institute of the Czech National Corpus in Prague or large Czech web corpora of the Aranea series). Three basic principles were used to update the dictionary: the Golden Rule of Morphology, the Principle of Paradigm Unity, and the Principle of Paradigm Uniqueness.

Klasifikace

  • Druh

    J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS

  • CEP obor

  • OECD FORD obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2018101" target="_blank" >LM2018101: Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2021

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    Jazykovedný Časopis

  • ISSN

    0021-5597

  • e-ISSN

    1338-4287

  • Svazek periodika

    72

  • Číslo periodika v rámci svazku

    4

  • Stát vydavatele periodika

    SK - Slovenská republika

  • Počet stran výsledku

    7

  • Strana od-do

    855-861

  • Kód UT WoS článku

  • EID výsledku v databázi Scopus

    2-s2.0-85138610519