Není k dispozici
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F04%3A03100584" target="_blank" >RIV/68407700:21230/04:03100584 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/61989100:27240/04:00010327
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Wordnet Ontology Based Model for Information Retrieval
Popis výsledku v původním jazyce
In the area of information retrieval, the dimension of document vectors plays an important role. Firstly, with higher dimensions index the indexing structures suffer from the "curse of dimensionality" and their efficiency rapidly decreases. Secondly, wemay not use exact words when looking for a document, thus we miss some relevant documents. LSI (Latent Semantic Indexing) is a numerical method, which discovers latent semantic in documents by creating concepts from existing terms. In this article we present a basic method mapping LSI concepts on given ontology - WordNet, used both for retrieval recall improvement and dimension reduction. We offer experimental results for this method on a subset of TREC collection, consisting of Los Angeles Times articles.
Název v anglickém jazyce
Wordnet Ontology Based Model for Information Retrieval
Popis výsledku anglicky
In the area of information retrieval, the dimension of document vectors plays an important role. Firstly, with higher dimensions index the indexing structures suffer from the "curse of dimensionality" and their efficiency rapidly decreases. Secondly, wemay not use exact words when looking for a document, thus we miss some relevant documents. LSI (Latent Semantic Indexing) is a numerical method, which discovers latent semantic in documents by creating concepts from existing terms. In this article we present a basic method mapping LSI concepts on given ontology - WordNet, used both for retrieval recall improvement and dimension reduction. We offer experimental results for this method on a subset of TREC collection, consisting of Los Angeles Times articles.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA201%2F03%2F1318" target="_blank" >GA201/03/1318: Inteligentní analýza obsahu a struktury WWW</a><br>
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2004
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the International Conference on Communications in Computing
ISBN
1-932415-36-X
ISSN
—
e-ISSN
—
Počet stran výsledku
7
Strana od-do
288-294
Název nakladatele
CSREA Press
Místo vydání
Las Vegas
Místo konání akce
Las Vegas
Datum konání akce
21. 6. 2004
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—