Homonymní příslovce a předložky a problematika jejich disambiguace v Českém národním korpusu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F14%3A10291142" target="_blank" >RIV/00216208:11210/14:10291142 - isvavai.cz</a>
Výsledek na webu
<a href="https://ucnk.ff.cuni.cz/kl2014/files/kl2014_abstrakty.pdf" target="_blank" >https://ucnk.ff.cuni.cz/kl2014/files/kl2014_abstrakty.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Homonymní příslovce a předložky a problematika jejich disambiguace v Českém národním korpusu
Popis výsledku v původním jazyce
Příspěvek je zaměřen na homonymní příslovce a předložky jako např. blízko, dovnitř, vstříc aj. V příspěvku je uveden jejich seznam, je zde analyzována distribuce těchto homonym v korpusu SYN2010 a úspěšnost jejich automatické disambiguace v tomto korpusua jsou zde systematizovány a analyzovány chyby, které se vyskytují v korpusové disambiguaci daných jednotek. Příspěvek také ukazuje, že problematika automatické disambiguace homonymních příslovcí a předložek vzniká na pozadí rozsáhlé morfologické homonymie v češtině a často se komplikuje homonymií pádových tvarů jmen. Prezentovaný výzkum je základem pro následné vypracování konkrétních lingvistických pravidel, která by mohla úspěšnost disambiguace daných jednotek v Českém národním korpusu zvýšit.
Název v anglickém jazyce
Homonymic adverbs and prepositions and the problematics of their disambiguation in the Czech national corpus
Popis výsledku anglicky
The article deals with homonymic adverbs and prepositions such as blízko, dovnitř, vstříc, etc. There is a list of them in the article, besides the distribution of these homonyms in the corpus SYN2010 and positive results of their automatical disambiguation in this corpus are analysed, there is also classification and analysis of the mistakes made by the corpus during the disambiguation of these units. It is concluded that the problems of the automatical disambiguation of homonymic adverbs and prepositions arise on the background of wide grammar homonymy in Czech language and are mainly complicated by homonymy of case forms of nouns. This research is considered to be the basis for follow-on development of particular linguistics rules necessary for improvement of the automatical disambiguation of homonymic adverbs and prepositions in the Czech national corpus.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů