Semi-Automatic Alignment of Multilingual Parts of Speech Tagsets
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F22%3A6YN4BT8K" target="_blank" >RIV/00216208:11320/22:6YN4BT8K - isvavai.cz</a>
Výsledek na webu
<a href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&pid=S1405-55462022000301365&lng=es&nrm=iso&tlng=en" target="_blank" >http://www.scielo.org.mx/scielo.php?script=sci_abstract&pid=S1405-55462022000301365&lng=es&nrm=iso&tlng=en</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.13053/cys-26-3-4357" target="_blank" >10.13053/cys-26-3-4357</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Semi-Automatic Alignment of Multilingual Parts of Speech Tagsets
Popis výsledku v původním jazyce
We cast the problem of mapping a pair of Parts of Speech (POS) tagsets as a labelled tree mapping problem and present a general-purpose semi-automatic POS tree alignment algorithm to solve the alignment. This algorithm can be used to align two POS tagsets of different languages or the same language. We evaluate its usefulness using POS tagsets of two languages: Tamil and Sinhala. The proposed approach shows that manual effort in prior approaches is drastically reduced due to the proposed algorithm and eliminates the need to create new POS tagsets.
Název v anglickém jazyce
Semi-Automatic Alignment of Multilingual Parts of Speech Tagsets
Popis výsledku anglicky
We cast the problem of mapping a pair of Parts of Speech (POS) tagsets as a labelled tree mapping problem and present a general-purpose semi-automatic POS tree alignment algorithm to solve the alignment. This algorithm can be used to align two POS tagsets of different languages or the same language. We evaluate its usefulness using POS tagsets of two languages: Tamil and Sinhala. The proposed approach shows that manual effort in prior approaches is drastically reduced due to the proposed algorithm and eliminates the need to create new POS tagsets.
Klasifikace
Druh
J<sub>imp</sub> - Článek v periodiku v databázi Web of Science
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
—
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Computacion y Sistemas
ISSN
1405-5546
e-ISSN
2007-9737
Svazek periodika
26
Číslo periodika v rámci svazku
3
Stát vydavatele periodika
MX - Spojené státy mexické
Počet stran výsledku
11
Strana od-do
1365-1375
Kód UT WoS článku
000930786300001
EID výsledku v databázi Scopus
2-s2.0-85139288211