Cross-Tagset Parsing Evaluation for Russian
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F18%3A10390143" target="_blank" >RIV/00216208:11320/18:10390143 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-319-69784-0" target="_blank" >http://dx.doi.org/10.1007/978-3-319-69784-0</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-69784-0" target="_blank" >10.1007/978-3-319-69784-0</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Cross-Tagset Parsing Evaluation for Russian
Popis výsledku v původním jazyce
Cross-tagset parsing is based on the substitution of one annotation layer for another while processing data within one language. As often as not, either the native tagger or the dependency parser used in (pre-)annotation of the Gold treebank is not available. The cross-tagset approach allows one to annotate new texts using freely available tools or tools optimized to user's needs. We evaluate the robustness of Russian dependency parsing using different morphological and syntactic tagsets in input and output. A qualitative analysis of errors shows that the cross-substitution of three morphological tagsets and two syntactic tagsets causes only a mild drop in performance.
Název v anglickém jazyce
Cross-Tagset Parsing Evaluation for Russian
Popis výsledku anglicky
Cross-tagset parsing is based on the substitution of one annotation layer for another while processing data within one language. As often as not, either the native tagger or the dependency parser used in (pre-)annotation of the Gold treebank is not available. The cross-tagset approach allows one to annotate new texts using freely available tools or tools optimized to user's needs. We evaluate the robustness of Russian dependency parsing using different morphological and syntactic tagsets in input and output. A qualitative analysis of errors shows that the cross-substitution of three morphological tagsets and two syntactic tagsets causes only a mild drop in performance.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Digital Transformation and Global Society
ISBN
978-3-030-02842-8
ISSN
1865-0929
e-ISSN
neuvedeno
Počet stran výsledku
11
Strana od-do
380-390
Název nakladatele
Springer International Publishing
Místo vydání
Cham
Místo konání akce
Sankt-Peterburg, Russia
Datum konání akce
30. 5. 2018
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—