Abui Wordnet: Using a Toolbox Dictionary to develop a wordnet for a low-resource language
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989592%3A15210%2F22%3A73618984" target="_blank" >RIV/61989592:15210/22:73618984 - isvavai.cz</a>
Výsledek na webu
<a href="https://aclanthology.org/2022.fieldmatters-1.7/" target="_blank" >https://aclanthology.org/2022.fieldmatters-1.7/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Abui Wordnet: Using a Toolbox Dictionary to develop a wordnet for a low-resource language
Popis výsledku v původním jazyce
This paper describes a procedure to link a Toolbox dictionary of a low-resource language to correct synsets, generating a new wordnet. We introduce a bootstrapping technique utilising the information in the gloss fields (English, national, and regional) to generate sense candidates using a naive algorithm based on multilingual sense intersection. We show that this technique is quite effective when glosses are available in more than one language. Our technique complements the previous work by Rosman et al. (2014) which linked the SIL Semantic Domains to wordnet senses. Through this work we have created a small, fully hand-checked wordnet for Abui, containing over 1,400 concepts and 3,600 senses.
Název v anglickém jazyce
Abui Wordnet: Using a Toolbox Dictionary to develop a wordnet for a low-resource language
Popis výsledku anglicky
This paper describes a procedure to link a Toolbox dictionary of a low-resource language to correct synsets, generating a new wordnet. We introduce a bootstrapping technique utilising the information in the gloss fields (English, national, and regional) to generate sense candidates using a naive algorithm based on multilingual sense intersection. We show that this technique is quite effective when glosses are available in more than one language. Our technique complements the previous work by Rosman et al. (2014) which linked the SIL Semantic Domains to wordnet senses. Through this work we have created a small, fully hand-checked wordnet for Abui, containing over 1,400 concepts and 3,600 senses.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
<a href="/cs/project/GA20-18407S" target="_blank" >GA20-18407S: Automatizace analýzy slovesných tříd pro ohrožené jazyky - RoboCorp</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of 1st Workshop on NLP applications to field linguistics
ISBN
—
ISSN
2951-2093
e-ISSN
—
Počet stran výsledku
10
Strana od-do
54-63
Název nakladatele
COLING: International Conference on Computational Linguistics
Místo vydání
Gyeongju
Místo konání akce
Gyeongju
Datum konání akce
16. 10. 2022
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—