Issues of POS Tagging of the (Diachronic) Corpus of Czech: Preparing a Morphological Dictionary
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F17%3A10366831" target="_blank" >RIV/00216208:11210/17:10366831 - isvavai.cz</a>
Výsledek na webu
<a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=GO4TCo8otw" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=GO4TCo8otw</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Issues of POS Tagging of the (Diachronic) Corpus of Czech: Preparing a Morphological Dictionary
Popis výsledku v původním jazyce
Many important decisions concerning the part-of-speech categorization remain unexplained in the current practice, only reported in corpus manuals. The aim of this paper is to offer a different perspective on the problems of morphological annotation of corpora - the perspective of mapping and analyzing conceptual problems in the annotation. Focused mainly on function words in Czech, we discuss the possibilities of POS tagging of the inherently ambiguous category of particles and we introduce criteria for distinguishing particles from interjections.
Název v anglickém jazyce
Issues of POS Tagging of the (Diachronic) Corpus of Czech: Preparing a Morphological Dictionary
Popis výsledku anglicky
Many important decisions concerning the part-of-speech categorization remain unexplained in the current practice, only reported in corpus manuals. The aim of this paper is to offer a different perspective on the problems of morphological annotation of corpora - the perspective of mapping and analyzing conceptual problems in the annotation. Focused mainly on function words in Czech, we discuss the possibilities of POS tagging of the inherently ambiguous category of particles and we introduce criteria for distinguishing particles from interjections.
Klasifikace
Druh
J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Jazykovedný časopis [online]
ISSN
1338-4287
e-ISSN
—
Svazek periodika
68
Číslo periodika v rámci svazku
2
Stát vydavatele periodika
SK - Slovenská republika
Počet stran výsledku
10
Strana od-do
316-325
Kód UT WoS článku
—
EID výsledku v databázi Scopus
2-s2.0-85048070834