Challenges in Converting the Index Thomisticus Treebank into Universal Dependencies
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F18%3A10390139" target="_blank" >RIV/00216208:11320/18:10390139 - isvavai.cz</a>
Výsledek na webu
<a href="http://aclweb.org/anthology/W18-6004" target="_blank" >http://aclweb.org/anthology/W18-6004</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Challenges in Converting the Index Thomisticus Treebank into Universal Dependencies
Popis výsledku v původním jazyce
This paper describes the changes applied to the original process used to convert the Index Thomisticus Treebank, a corpus including texts in Medieval Latin by Thomas Aquinas, into the annotation style of Universal Dependencies. The changes are made both to harmonise the Universal Dependencies version of the Index Thomisticus Treebank with the two other available Latin treebanks and to fix errors and inconsistencies resulting from the original process. The paper details the treatment of different issues in PoS tagging, lemmatisation and assignment of dependency relations. Finally, it assesses the quality of the new conversion process by providing an evaluation against a gold standard.
Název v anglickém jazyce
Challenges in Converting the Index Thomisticus Treebank into Universal Dependencies
Popis výsledku anglicky
This paper describes the changes applied to the original process used to convert the Index Thomisticus Treebank, a corpus including texts in Medieval Latin by Thomas Aquinas, into the annotation style of Universal Dependencies. The changes are made both to harmonise the Universal Dependencies version of the Index Thomisticus Treebank with the two other available Latin treebanks and to fix errors and inconsistencies resulting from the original process. The paper details the treatment of different issues in PoS tagging, lemmatisation and assignment of dependency relations. Finally, it assesses the quality of the new conversion process by providing an evaluation against a gold standard.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the Second Workshop on Universal Dependencies (UDW 2018)
ISBN
978-1-948087-78-0
ISSN
—
e-ISSN
neuvedeno
Počet stran výsledku
10
Strana od-do
27-36
Název nakladatele
Association for Computational Linguistics
Místo vydání
Bruxelles, Belgium
Místo konání akce
Bruxelles, Belgium
Datum konání akce
1. 11. 2018
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—