Managing Uncertainty in Semantic Tagging
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F12%3A10130035" target="_blank" >RIV/00216208:11320/12:10130035 - isvavai.cz</a>
Výsledek na webu
<a href="http://aclweb.org/anthology-new/E/E12/E12-1085.pdf" target="_blank" >http://aclweb.org/anthology-new/E/E12/E12-1085.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Managing Uncertainty in Semantic Tagging
Popis výsledku v původním jazyce
Low interannotator agreement (IAA) is a well-known issue in manual semantic tagging (sense tagging). IAA correlates with the granularity of word senses and they both correlate with the amount of information they give as well as with its reliability. We compare different approaches to semantic tagging in WordNet, FrameNet, Prop- Bank and OntoNotes with a small tagged data sample based on the Corpus Pattern Analysis to present the reliable information gain (RG), a measure used to optimize the semantic granularity of a sense inventory with respect to its reliability indicated by the IAA in the given data set. RG can also be used as feedback for lexicographers, and as a supporting component of automatic semantic classifiers, especially when dealing with avery fine-grained set of semantic categories.
Název v anglickém jazyce
Managing Uncertainty in Semantic Tagging
Popis výsledku anglicky
Low interannotator agreement (IAA) is a well-known issue in manual semantic tagging (sense tagging). IAA correlates with the granularity of word senses and they both correlate with the amount of information they give as well as with its reliability. We compare different approaches to semantic tagging in WordNet, FrameNet, Prop- Bank and OntoNotes with a small tagged data sample based on the Corpus Pattern Analysis to present the reliable information gain (RG), a measure used to optimize the semantic granularity of a sense inventory with respect to its reliability indicated by the IAA in the given data set. RG can also be used as feedback for lexicographers, and as a supporting component of automatic semantic classifiers, especially when dealing with avery fine-grained set of semantic categories.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of 13th Conference of the European Chapter of the Association for Computational Linguistics
ISBN
978-1-937284-19-0
ISSN
—
e-ISSN
—
Počet stran výsledku
11
Strana od-do
840-850
Název nakladatele
Association for Computational Linguistics
Místo vydání
Avignon, France
Místo konání akce
Avignon, France
Datum konání akce
23. 4. 2012
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—