HOMONYMY BETWEEN OIKONYMS AND ANTHROPONYMS ENDING IN -SLAV/-SLAVA AS A PROBLEM OF AUTOMATIC MORPHOLOGICAL ANALYSIS
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14210%2F20%3A00123063" target="_blank" >RIV/00216224:14210/20:00123063 - isvavai.cz</a>
Result on the web
<a href="http://www.ujc.cas.cz/miranda2/export/sitesavcr/ujc/sys/galerie-download/acta-onomastica/OBSAH-1-2020.pdf" target="_blank" >http://www.ujc.cas.cz/miranda2/export/sitesavcr/ujc/sys/galerie-download/acta-onomastica/OBSAH-1-2020.pdf</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
HOMONYMIE MEZI OIKONYMY A ANTROPONYMY ZAKONČENÝMI NA -SLAV/-SLAVA JAKO PROBLÉM AUTOMATICKÉ MORFOLOGICKÉ ANALÝZY
Original language description
Homonymie na všech úrovních, která je charakteristickým rysem všech přirozených jazyků, je také jedna z nejvýznamnějších překážek automatického zpracování přirozeného jazyka. V tomto příspěvku poukážeme na morfosyntaktické rozdíly českých antroponym zakončených na -slav (typu Miroslav, mužský rodu) a českých oikonym se stejnou koncovkou (typ Miroslav, ženský rod) a českých antroponym zakončených na -slava (ženský rod typu Miroslava, protože jeho tvary jsou homonymní s oběma: mužskými antroponymy i ženskými oikonymy). Analýza dat z korpusu Syn v8 ukazuje, že slovní forma homonymie významně ovlivňuje výsledky automatické morfologické analýzy. Dokumentujeme chyby v pokrytí morfologického slovníku a především chyby v morfologickém značkování a navrhujeme řešení, jak částečně zlepšit desambiguaci daného typu vlastních podstatných jmen.
Czech name
HOMONYMIE MEZI OIKONYMY A ANTROPONYMY ZAKONČENÝMI NA -SLAV/-SLAVA JAKO PROBLÉM AUTOMATICKÉ MORFOLOGICKÉ ANALÝZY
Czech description
Homonymie na všech úrovních, která je charakteristickým rysem všech přirozených jazyků, je také jedna z nejvýznamnějších překážek automatického zpracování přirozeného jazyka. V tomto příspěvku poukážeme na morfosyntaktické rozdíly českých antroponym zakončených na -slav (typu Miroslav, mužský rodu) a českých oikonym se stejnou koncovkou (typ Miroslav, ženský rod) a českých antroponym zakončených na -slava (ženský rod typu Miroslava, protože jeho tvary jsou homonymní s oběma: mužskými antroponymy i ženskými oikonymy). Analýza dat z korpusu Syn v8 ukazuje, že slovní forma homonymie významně ovlivňuje výsledky automatické morfologické analýzy. Dokumentujeme chyby v pokrytí morfologického slovníku a především chyby v morfologickém značkování a navrhujeme řešení, jak částečně zlepšit desambiguaci daného typu vlastních podstatných jmen.
Classification
Type
J<sub>SC</sub> - Article in a specialist periodical, which is included in the SCOPUS database
CEP classification
—
OECD FORD branch
60203 - Linguistics
Result continuities
Project
—
Continuities
S - Specificky vyzkum na vysokych skolach
Others
Publication year
2020
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Acta onomastica
ISSN
1211-4413
e-ISSN
—
Volume of the periodical
62
Issue of the periodical within the volume
2
Country of publishing house
CZ - CZECH REPUBLIC
Number of pages
27
Pages from-to
377-403
UT code for WoS article
—
EID of the result in the Scopus database
2-s2.0-85120687005