A Study on Bilingually Informed Coreference Resolution
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F18%3A10390194" target="_blank" >RIV/00216208:11320/18:10390194 - isvavai.cz</a>
Výsledek na webu
<a href="http://ceur-ws.org/Vol-2203/130.pdf" target="_blank" >http://ceur-ws.org/Vol-2203/130.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
A Study on Bilingually Informed Coreference Resolution
Popis výsledku v původním jazyce
Coreference is a basic means to retain coherence of a text that likely exists in every language. However, languages may differ in how a coreference relation is manifested on the surface. A possible way how to measure the extent and nature of such differences is to build a coreference resolution system that operates on a parallel corpus and extracts information from both language sides of the corpus. In this work, we build such a bilingually informed coreference resolution system and apply it on Czech-English data. We compare its performance with the system that learns only from a single language. Our results show that the cross-lingual approach outperforms the monolingual one. They also suggest that a system for Czech can exploit the additional English information more effectively than the other way round. The work concludes with a detailed analysis that tries to reveal the reasons behind these results.
Název v anglickém jazyce
A Study on Bilingually Informed Coreference Resolution
Popis výsledku anglicky
Coreference is a basic means to retain coherence of a text that likely exists in every language. However, languages may differ in how a coreference relation is manifested on the surface. A possible way how to measure the extent and nature of such differences is to build a coreference resolution system that operates on a parallel corpus and extracts information from both language sides of the corpus. In this work, we build such a bilingually informed coreference resolution system and apply it on Czech-English data. We compare its performance with the system that learns only from a single language. Our results show that the cross-lingual approach outperforms the monolingual one. They also suggest that a system for Czech can exploit the additional English information more effectively than the other way round. The work concludes with a detailed analysis that tries to reveal the reasons behind these results.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-05394S" target="_blank" >GA16-05394S: Struktura koreferenčních řetězců v paralelních jazykových datech</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 18th conference ITAT 2018: Slovenskočeský NLP workshop (SloNLP 2018)
ISBN
978-1-72726-719-8
ISSN
1613-0073
e-ISSN
neuvedeno
Počet stran výsledku
8
Strana od-do
130-137
Název nakladatele
CreateSpace Independent Publishing Platform
Místo vydání
Košice, Slovakia
Místo konání akce
Plejsy, Slovakia
Datum konání akce
22. 9. 2018
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—