Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Synonymní/variantní tvary infinitivu jako problém konzistentní lemmatizace

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14210%2F20%3A00120996" target="_blank" >RIV/00216224:14210/20:00120996 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Synonymní/variantní tvary infinitivu jako problém konzistentní lemmatizace

  • Popis výsledku v původním jazyce

    Cílem tohoto textu je podat ucelený obraz jedné oblasti automatického zpracování přirozeného jazyka (češtiny), a sice lemmatizace slovesných tvarů. Existují-li dvě varianty infinitivu, které lze pokládat za synonymní, je třeba je zahrnout pod koncept tzv. několikanásobného lemmatu. Nabízíme pokud možno kompletní seznam takových případů sestavený na základě gramatik, slovníků a především jazykových korpusů.

  • Název v anglickém jazyce

    Synonymous/variant forms of infinitive as a problem of consistent lemmatization

  • Popis výsledku anglicky

    The aim of our text is to give a comprehensive picture of the consistent lemmatization of verb forms. If we have two variants of an infinitive such, that they can be considered synonymous (myslet / myslit), then, let the concept of multiple lemma be applied. Here, we give a complete list containing the synonymous lemmas of Czech verbs extracted from grammars, dictionaries and the large language corpora.

Klasifikace

  • Druh

    C - Kapitola v odborné knize

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

  • Návaznosti

    S - Specificky vyzkum na vysokych skolach

Ostatní

  • Rok uplatnění

    2020

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název knihy nebo sborníku

    Lingvistika – korpus – empirie

  • ISBN

    9788088211136

  • Počet stran výsledku

    14

  • Strana od-do

    28-41

  • Počet stran knihy

    244

  • Název nakladatele

    Ústav pro jazyk český AV ČR, v. v. i.

  • Místo vydání

    Praha

  • Kód UT WoS kapitoly