Detecting Annotation Errors in a Corpus by Induction of Syntactic Patterns
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F03%3A00008945" target="_blank" >RIV/00216224:14330/03:00008945 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Detecting Annotation Errors in a Corpus by Induction of Syntactic Patterns
Popis výsledku v původním jazyce
This paper brings a new method for acquisition of syntactic patterns capable of detecting errors in annotated corpora. These patterns are acquired semi-automatically, by means of an inductive logic programming (relational data mining) system followed bya human expert supervision. The patterns acquired have been used for automatic detection and subsequent manual correction of the annotation errors found in DESAM, a morphologically annotated corpus of written Czech.
Název v anglickém jazyce
Detecting Annotation Errors in a Corpus by Induction of Syntactic Patterns
Popis výsledku anglicky
This paper brings a new method for acquisition of syntactic patterns capable of detecting errors in annotated corpora. These patterns are acquired semi-automatically, by means of an inductive logic programming (relational data mining) system followed bya human expert supervision. The patterns acquired have been used for automatic detection and subsequent manual correction of the annotation errors found in DESAM, a morphologically annotated corpus of written Czech.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Text, Speech and Dialogue: Sixth International Conference, TSD 2003
ISBN
3-540-200-24-X
ISSN
—
e-ISSN
—
Počet stran výsledku
8
Strana od-do
74-81
Název nakladatele
Springer Verlag
Místo vydání
Berlin
Místo konání akce
České Budějovice, Czech republic
Datum konání akce
9. 9. 2003
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—