Analyzing the Most Common Errors in the Discourse Annotation of the Prague Dependency Treebank
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F12%3A10130065" target="_blank" >RIV/00216208:11320/12:10130065 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Analyzing the Most Common Errors in the Discourse Annotation of the Prague Dependency Treebank
Popis výsledku v původním jazyce
We present an analysis of the inter-annotator discrepancies of the Czech discourse annotation in the Prague Dependency Treebank 2.0. Having finished the annotation of the inter-sentential semantic discourse relations with explicit connectives in the treebank, we report now on the results of the evaluation of the parallel (double) annotations, which is an important step in the process of checking the quality of the data. After we shortly describe the annotation and the method of the inter-annotator agreement measurement, we present the results of the measurement and, most importantly, we classify and analyze the most common types of annotators' disagreement.
Název v anglickém jazyce
Analyzing the Most Common Errors in the Discourse Annotation of the Prague Dependency Treebank
Popis výsledku anglicky
We present an analysis of the inter-annotator discrepancies of the Czech discourse annotation in the Prague Dependency Treebank 2.0. Having finished the annotation of the inter-sentential semantic discourse relations with explicit connectives in the treebank, we report now on the results of the evaluation of the parallel (double) annotations, which is an important step in the process of checking the quality of the data. After we shortly describe the annotation and the method of the inter-annotator agreement measurement, we present the results of the measurement and, most importantly, we classify and analyze the most common types of annotators' disagreement.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 11th International Workshop on Treebanks and Linguistic Theories
ISBN
978-989-689-274-6
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
127-132
Název nakladatele
Edicoes Colibri, Lisboa
Místo vydání
Lisboa, Portugal
Místo konání akce
Lisboa, Portugal
Datum konání akce
30. 11. 2012
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—