Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Korpusy jako zdroje dat pro úpravy nástrojů automatické morfologické analýzy (Slovotvorné varianty adjektiv na [(ou)|í]cí z hlediska morfologického značkování)

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14210%2F15%3A00083711" target="_blank" >RIV/00216224:14210/15:00083711 - isvavai.cz</a>

  • Výsledek na webu

    <a href="http://cmf.ff.cuni.cz/?q=cs/node/24" target="_blank" >http://cmf.ff.cuni.cz/?q=cs/node/24</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Korpusy jako zdroje dat pro úpravy nástrojů automatické morfologické analýzy (Slovotvorné varianty adjektiv na [(ou)|í]cí z hlediska morfologického značkování)

  • Popis výsledku v původním jazyce

    Cílem našeho příspěvku je naznačit, jak 20 let užívání nástrojů automatické morfologické analýzy k morfologickému značkování českých korpusů přispívá k poznání fungování pravidelných paradigmatických derivací v jazyce. Soustředíme se na jeden z případů pravidelných derivací (adjektiva na -oucí/-ící), které jsou na úrovni slovníků automatických analyzátorů zachyceny analogicky jako pravidelně tvořené gramatické tvary . Ukážeme, že značkování adjektiv pravidelně tvořených a na rovině slovníku automatického morfologického analyzátoru automaticky generovaných (s oporou ve slovesném tvaru 3. os. pl./ přechodníku přítomného) není na rovině morfologického slovníku užitého pro morfologické značkování (taging) českých korpusů řady SYN uspokojivě vyřešeno. Na základě pozorování korpusových dat ukážeme, že hlavním důvodem nekonzistencí je existence tvarových variant/dublet opěrných tvarů. Tvarové varianty/dublety jsou příčinou vzniku slovotvorných dublet.

  • Název v anglickém jazyce

    Corpora As Data Sources For The Up-Grading Of Morphological Tagging

  • Popis výsledku anglicky

    Adjectives ending with -oucí/-ící are regularly derived from verbs and hence are not usually listed in any of the Czech monolingual dictionaries. On the level of automatic morphological analysis (the dictionary) of Czech they should be generated from verbal roots and tagged as verbal adjectives (pos tag: AG.*). The data from Czech corpora prove a) inconsistencies in tagging and b) gaps in the dictionary. The main cause of both kinds of insufficiency is the existence of variants on the level of verbal forms from which the verbal adjectives are potentially derived. Consequently, text corpora are a significant source of knowledge about the formation and use of adjectives with endings -oucí/-ící that can be important for both a) automatic morphological analysis of Czech and b) theoretical description of Czech grammar (derivational morphology). Our goal is to present a corpus-based study of the Czech gerund, i.e. verbal adjectives with -oucí/-ící.

Klasifikace

  • Druh

    J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)

  • CEP obor

    AI - Jazykověda

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

  • Rok uplatnění

    2015

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    Časopis pro moderní filologii

  • ISSN

    0008-7386

  • e-ISSN

  • Svazek periodika

    97

  • Číslo periodika v rámci svazku

    2

  • Stát vydavatele periodika

    CZ - Česká republika

  • Počet stran výsledku

    10

  • Strana od-do

    136-145

  • Kód UT WoS článku

  • EID výsledku v databázi Scopus