The first Universal Dependency Treebank for Tswana: Tswana-Popapolelo
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F25%3AQDCFPF5W" target="_blank" >RIV/00216208:11320/25:QDCFPF5W - isvavai.cz</a>
Výsledek na webu
<a href="https://www.scopus.com/inward/record.uri?eid=2-s2.0-85195182719&partnerID=40&md5=92eb72f425ea5c4c93689cf5162ccd8b" target="_blank" >https://www.scopus.com/inward/record.uri?eid=2-s2.0-85195182719&partnerID=40&md5=92eb72f425ea5c4c93689cf5162ccd8b</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
The first Universal Dependency Treebank for Tswana: Tswana-Popapolelo
Popis výsledku v původním jazyce
This paper presents the first publicly available UD treebank for Tswana, Tswana-Popapolelo. The data used consists of the 20 Cairo CICLing sentences translated to Tswana. After preprocessing these sentences with detailed POS (XPOS) and converting them to universal POS (UPOS), we proceeded to annotate the data with dependency relations, documenting decisions for the language specific constructions. Linguistic issues encountered are described in detail as this is the first application of the UD framework to produce a dependency treebank for the Bantu language family in general and for Tswana specifically. © 2024 ELRA Language Resource Association.
Název v anglickém jazyce
The first Universal Dependency Treebank for Tswana: Tswana-Popapolelo
Popis výsledku anglicky
This paper presents the first publicly available UD treebank for Tswana, Tswana-Popapolelo. The data used consists of the 20 Cairo CICLing sentences translated to Tswana. After preprocessing these sentences with detailed POS (XPOS) and converting them to universal POS (UPOS), we proceeded to annotate the data with dependency relations, documenting decisions for the language specific constructions. Linguistic issues encountered are described in detail as this is the first application of the UD framework to produce a dependency treebank for the Bantu language family in general and for Tswana specifically. © 2024 ELRA Language Resource Association.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
—
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Workshop Resour. African Indig. Lang., RAIL LREC-COLING - Workshop Proc.
ISBN
978-249381440-1
ISSN
—
e-ISSN
—
Počet stran výsledku
11
Strana od-do
55-65
Název nakladatele
European Language Resources Association (ELRA)
Místo vydání
—
Místo konání akce
Torino, Italia
Datum konání akce
1. 1. 2025
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—