Identification of root morphs in morphologically segmented data
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F23%3A10475938" target="_blank" >RIV/00216208:11320/23:10475938 - isvavai.cz</a>
Výsledek na webu
<a href="https://derimo.ffzg.unizg.hr/media/uploads/proceedings/derimo2023.pdf" target="_blank" >https://derimo.ffzg.unizg.hr/media/uploads/proceedings/derimo2023.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Identification of root morphs in morphologically segmented data
Popis výsledku v původním jazyce
As a result of the ongoing push for unification, extension and integration of morphological resources, need arises for reliable low-resource morph classification, especially root identification. The paper reports on our experiments with multiple root identification methods with various degrees of supervision, tested on several Indo-European languages, showing, among others, that given morphological segmentation, surprisingly good root identification can be achieved using simple unsupervised statistical methods, the main bottlenecks being compounding and homomorphy resolution.
Název v anglickém jazyce
Identification of root morphs in morphologically segmented data
Popis výsledku anglicky
As a result of the ongoing push for unification, extension and integration of morphological resources, need arises for reliable low-resource morph classification, especially root identification. The paper reports on our experiments with multiple root identification methods with various degrees of supervision, tested on several Indo-European languages, showing, among others, that given morphological segmentation, surprisingly good root identification can be achieved using simple unsupervised statistical methods, the main bottlenecks being compounding and homomorphy resolution.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
2023: Zagreb, Croatia: DeriMo 2023: The Fourth International Workshop on Resources and Tools for Derivational Morphology
ISBN
978-953-55375-5-7
ISSN
—
e-ISSN
—
Počet stran výsledku
10
Strana od-do
23-32
Název nakladatele
Croatian Language Technology Society
Místo vydání
Zagreb, Croatia
Místo konání akce
Dubrovnik, Croatia
Datum konání akce
5. 10. 2023
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—