Coreference Resolution System Not Only for Czech
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F17%3A10372164" target="_blank" >RIV/00216208:11320/17:10372164 - isvavai.cz</a>
Výsledek na webu
<a href="http://ceur-ws.org/Vol-1885/193.pdf" target="_blank" >http://ceur-ws.org/Vol-1885/193.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Coreference Resolution System Not Only for Czech
Popis výsledku v původním jazyce
The paper introduces Treex CR, a coreference resolution (CR) system not only for Czech. As its name suggests, it has been implemented as an integral part of the Treex NLP framework. The main feature that distinguishes it from other CR systems is that it operates on the tectogrammatical layer, a representation of deep syntax. This feature allows for natural handling of elided expressions, e.g. unexpressed subjects in Czech as well as generally ignored English anaphoric expression - relative pronouns and zeros. The system implements a sequence of mention ranking models specialized at particular types of coreferential expressions (relative, reflexive, personal pronouns etc.). It takes advantage of rich feature set extracted from the data linguistically preprocessed with Treex. We evaluated Treex CR on Czech and English datasets and compared it with other systems as well as with modules used in Treex so far.
Název v anglickém jazyce
Coreference Resolution System Not Only for Czech
Popis výsledku anglicky
The paper introduces Treex CR, a coreference resolution (CR) system not only for Czech. As its name suggests, it has been implemented as an integral part of the Treex NLP framework. The main feature that distinguishes it from other CR systems is that it operates on the tectogrammatical layer, a representation of deep syntax. This feature allows for natural handling of elided expressions, e.g. unexpressed subjects in Czech as well as generally ignored English anaphoric expression - relative pronouns and zeros. The system implements a sequence of mention ranking models specialized at particular types of coreferential expressions (relative, reflexive, personal pronouns etc.). It takes advantage of rich feature set extracted from the data linguistically preprocessed with Treex. We evaluated Treex CR on Czech and English datasets and compared it with other systems as well as with modules used in Treex so far.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/GA16-05394S" target="_blank" >GA16-05394S: Struktura koreferenčních řetězců v paralelních jazykových datech</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 17th conference ITAT 2017: Slovenskočeský NLP workshop (SloNLP 2017)
ISBN
978-1-974274-74-1
ISSN
1613-0073
e-ISSN
neuvedeno
Počet stran výsledku
8
Strana od-do
193-200
Název nakladatele
CreateSpace Independent Publishing Platform
Místo vydání
Praha, Czechia
Místo konání akce
Martinské hole, Malá Fatra, Slovakia
Datum konání akce
23. 9. 2017
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—