Synonymní/variantní tvary verbálního substantiva jako problém konzistentní lemmatizace
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A90244%2F24%3A10495872" target="_blank" >RIV/00216208:90244/24:10495872 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/00216224:14210/24:00137627
Výsledek na webu
<a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=lqYy99DpfD" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=lqYy99DpfD</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.19195/0137-1150.179.11" target="_blank" >10.19195/0137-1150.179.11</a>
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Synonymní/variantní tvary verbálního substantiva jako problém konzistentní lemmatizace
Popis výsledku v původním jazyce
ako východisko pro náš příspěvek z oblasti počítačového zpracování přirozeného jazyka, konkrétně automatické morfologické analýzy, jsme zvolili dva koncepty, které byly propracovány v rámci projektu NovaMorf. První z nich představuje koncept vícenásobného lemmatu a druhý vy- jadřuje tzv. zlaté pravidlo morfologie, tedy požadavek na systematické zpracování variant, aby se každá varianta lišila dvojicí lemma + tag. Tyto dva požadavky vedou k systematickému korpuso- vému studiu variací v české morfologii. Cílem našeho příspěvku je podat ucelený obraz o důsledné lemmatizaci slovesných podstatných jmen zakončených na -ní/-tí, a to zejména v těch případech, kdy lze dějové jméno vytvořit od dvou podob kmene minulého, jako například nařčení/nařknutí, vysání/vysátí, zmražení/zmrazení ad. Popis tvarosloví verbálních substantiv v synchronní podobě prezentovaný morfologickou anotací korpusů řady SYN (nejnověji syn_v10) vykazuje nekonzistentní řešení v případě, že ver- bální substantivum má variantní tvary. Zaměříme se tudíž na interpretace tvarů verbálních sub- stantiv od variant jednoho slovesa tvořených od variantního kmene, které lze interpretovat jako tvary synonymní/variantní. Také se budeme snažit zaznamenat nedostatky pokrytí morfologické- ho slovníku MorfFlex.
Název v anglickém jazyce
Synonymous/variant forms of verbal nouns as a problem of consistent lemmatization
Popis výsledku anglicky
The NovaMorf project provided us with two following proposals which have been accepted as our point of departure. The fi rst introduces a concept of the multiple lemma. The second ex-presses the so-called golden rule of morphology, i.e. the requirement for systematic processing of variants, so that each variant would diff er by a pair of lemma + tag. These two requirements lead to the systematic corpus-based study of the variations in the Czech morphology. The aim of our text is to give a comprehensive picture of the consistent lemmatization of verbal nouns on -ní/-tí. If we have two variants of a verbal noun such that they can be considered synonymous (nařčení/nařknutí), then, let the concept of multiple lemma be applied. Here, we give a complete list con-taining the synonymous lemmas of Czech verbal nouns extracted from grammars, dictionaries and the large language corpora.
Klasifikace
Druh
J<sub>ost</sub> - Ostatní články v recenzovaných periodicích
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
—
Návaznosti
—
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Acta Universitatis Wratislaviensis. Slavica Wratislaviensia
ISSN
0137-1150
e-ISSN
2957-2312
Svazek periodika
179
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
PL - Polská republika
Počet stran výsledku
17
Strana od-do
149-165
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—