Homonymie mezi apelativy a proprii jako problém automatické morfologické analýzy češtiny
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14210%2F20%3A00115564" target="_blank" >RIV/00216224:14210/20:00115564 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.ujc.cas.cz/miranda2/export/sitesavcr/ujc/sys/galerie-download/acta-onomastica/OBSAH-1-2020.pdf" target="_blank" >http://www.ujc.cas.cz/miranda2/export/sitesavcr/ujc/sys/galerie-download/acta-onomastica/OBSAH-1-2020.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Homonymie mezi apelativy a proprii jako problém automatické morfologické analýzy češtiny
Popis výsledku v původním jazyce
Cílem této práce je korpusová analýza jednoho typu českých podstatných jmen (typ Zubří). Adekvátní anotace (lemmatizace a morfologické značkování) vlastních podstatných jmen typu Zubří závisí na několika okolnostech: 1) pokrytí slovníku automatického analyzátoru; 2) přesný popis variability forem flexe; 3) netriviální desambiguace četných homonymních slovních forem. Věříme, že i když je splnění prvních dvou podmínek možné, adekvátní desambiguace jde nad možnosti automatické morfologické analýzy.
Název v anglickém jazyce
Homonymy among Czech common and proper nouns as the problem of automatic morphological analysis
Popis výsledku anglicky
The aim of this paper is a corpus-based analysis of one type of Czech proper nouns (type Zubří). We will argue that adequate annotation (lemmatisation and morphological tagging) of proper nouns type Zubří depends on several circumstances: 1) coverage of the dictionary of the automatic analyzer; 2) accurate description of the variability of inflexion forms; 3) not trivial disambiguation of numerous homonym word-forms. We believe that while satisfying the first two conditions is possible, adequate disambiguation goes beyond the possibilities of automatic morphological analysis.
Klasifikace
Druh
J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2020
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Acta onomastica
ISSN
1211-4413
e-ISSN
—
Svazek periodika
61
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
14
Strana od-do
161-174
Kód UT WoS článku
—
EID výsledku v databázi Scopus
2-s2.0-85083420877