Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Lhoucí nebo lžoucí ? Slovotvorné dublety procesuálních adjektiv na -oucí/-ící v českých korpusech

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14210%2F14%3A00075733" target="_blank" >RIV/00216224:14210/14:00075733 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Lhoucí nebo lžoucí ? Slovotvorné dublety procesuálních adjektiv na -oucí/-ící v českých korpusech

  • Popis výsledku v původním jazyce

    Naším cílem je představit bohatství slovotvorných dublet procesuálních adjektiv v češtině. Poukážeme na vliv potenciálních dublet/triplet opěrných tvarů na tvoření procesuálních adjektiv na -oucí/-ící. Na ukázkách z korpusů demonstrujeme využití potenciality jazyka v oblasti paradigmatického tvoření. Budeme si všímat problému přegenerování při vyhledávání jednotlivých variant pomocí nástroje Morfio. Tento problém může zaujmout nejen odborníky na NLP, ale i studenty češtiny jako cizího jazyka, pro kterébývá kamenem úrazu jak existence mnoha variant (s ohledem na jejich užití, které lze v korpusech dobře sledovat), tak problém přegenerování při aplikaci pracně naučených pravidel českého tvarosloví a slovotvorby.

  • Název v anglickém jazyce

    Lhoucí or lžoucí ? Variants of Czech gerund (verbal adjectives on -oucí/-ící)

  • Popis výsledku anglicky

    Our goal is to present a corpus driven study of Czech gerund (verbal adjectives on -oucí/-ící). The link between inflective and word formation variants will be demonstrated on the material from corpus SYN (2,6 milliard tokens of written Czech) and largeweb corpus czTenTen12 (5,2 milliard tokens of Czech text from internet ? cleaned and deduplicated). On some practical examples we shall display the overgeneration of word formation rules, witch is a problem of both NLP and second language mastering. Theadjectives on -oucí/-ící are regularly derived from verbs hence are not usually registered in Czech monolingual dictionaries. Consequently text corpora are significant source of knowledge of their formation and of their usage, which can be a thing of importance for non-native speakers.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

    AI - Jazykověda

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

  • Rok uplatnění

    2014

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    Přednášky a besedy ze XLVII. běhu LŠSS

  • ISBN

    9788021068001

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    20

  • Strana od-do

    124-143

  • Název nakladatele

    Masarykova univerzita

  • Místo vydání

    Brno

  • Místo konání akce

    Brno

  • Datum konání akce

    1. 1. 2014

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku