Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Přegenerování a podgenerování : Jak efektivně vyhledávat v jazykových korpusech data pro lingvistický výzkum

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14210%2F24%3A00137906" target="_blank" >RIV/00216224:14210/24:00137906 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Přegenerování a podgenerování : Jak efektivně vyhledávat v jazykových korpusech data pro lingvistický výzkum

  • Popis výsledku v původním jazyce

    V přednášce ukážeme na případu typu kutil (deverbativních názvů osob - apelativ/proprií - tvořených konverzí l-ového příčestí k deklinačnímu typu pán), jak lze při kladení dotazu v korpusově založeném výzkumu slovotvorby korigovat přegenerování (zvýšit přesnost) a zabránit podgenerování (udržet pokrytí). Ověříme meze a možnosti formálního popisu (algoritmizace). Představíme výsledky kvantitativní analýzy založené na datech získaných z korpusu (corpus based). Naznačíme, jak lze data využít pro výzkum proprií. Zmíníme se o možnostech využití v počítačovém zpracování přirozeného jazyka (natural language processing - NLP), konkrétně pro oblast automatické morfologické analýzy.

  • Název v anglickém jazyce

    Over/under Generating : How to Search Data for Linguistic Analysis in Language Corpora

  • Popis výsledku anglicky

    In this talk, we will show, how to minimize the overgeneration (to increase accuracy) and to prevent undergeneration (to maintain coverage) in corpus-based word formation research. On a specific example of retrieval of candidates for a word formation model (kutil) we shall show how to use observation of corpus data for progressive specification of corpus query. The data obtained from the corpus will be analysed from a quantitative and qualitative point of view. Next, we show to what extent homonymy of nouns formed by conversion of l-participles has a negative effect on the results of POS disambiguation.

Klasifikace

  • Druh

    O - Ostatní výsledky

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

  • Návaznosti

    S - Specificky vyzkum na vysokych skolach

Ostatní

  • Rok uplatnění

    2024

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů