Various Approaches to Text Representation for Named Entity Disambiguation
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F12%3A10132016" target="_blank" >RIV/00216208:11320/12:10132016 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/68407700:21240/12:00197088
Výsledek na webu
<a href="http://research.i-lasek.cz/_media/iiwas2012_lasek.pdf" target="_blank" >http://research.i-lasek.cz/_media/iiwas2012_lasek.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Various Approaches to Text Representation for Named Entity Disambiguation
Popis výsledku v původním jazyce
In this paper, we focus on the problem of named entity disambiguation. We disambiguate named entities on a very detailed level. To each entity is assigned a concrete identifier of a corresponding Wikipedia article describing the entity. For such a fine grained disambiguation a correct representation of a context is crucial. We compare various context representations: bag of words representation, linguistic representation and structured co-occurrence representation of the context. Models for each representation are described and evaluated.
Název v anglickém jazyce
Various Approaches to Text Representation for Named Entity Disambiguation
Popis výsledku anglicky
In this paper, we focus on the problem of named entity disambiguation. We disambiguate named entities on a very detailed level. To each entity is assigned a concrete identifier of a corresponding Wikipedia article describing the entity. For such a fine grained disambiguation a correct representation of a context is crucial. We compare various context representations: bag of words representation, linguistic representation and structured co-occurrence representation of the context. Models for each representation are described and evaluated.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GAP202%2F10%2F0761" target="_blank" >GAP202/10/0761: Semantizace webu</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of Information Integration and Web-based Applications & Services
ISBN
978-1-4503-1306-3
ISSN
—
e-ISSN
—
Počet stran výsledku
7
Strana od-do
256-262
Název nakladatele
ACM Press
Místo vydání
New York
Místo konání akce
Bali, Indonesia
Datum konání akce
3. 12. 2012
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—