Random Projections for Dimension Reduction in Information Retrieval Systems
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989100%3A27240%2F03%3A00008379" target="_blank" >RIV/61989100:27240/03:00008379 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Random Projections for Dimension Reduction in Information Retrieval Systems
Popis výsledku v původním jazyce
Information retrieval deals with storage and searching of textual documents. One from the models of the information retrieval systems is the vector model. In vector model the term-by-document matrix is formed from vectors of documents. Some methods of the term-by-document matrix reduction have been developed in the past. Random projection is a method of dimensionality reduction significantly faster than principal component analysis and singular value decomposition. It uses projection matrix with zero-mean unit-variance random distribution and its error can be controlled easily. Tests on image data were executed recently to show distortion caused by projection. In this paper we present a measurement of precision and recall in vector model performed on real-life text data by comparison of results before and after the projection.
Název v anglickém jazyce
Random Projections for Dimension Reduction in Information Retrieval Systems
Popis výsledku anglicky
Information retrieval deals with storage and searching of textual documents. One from the models of the information retrieval systems is the vector model. In vector model the term-by-document matrix is formed from vectors of documents. Some methods of the term-by-document matrix reduction have been developed in the past. Random projection is a method of dimensionality reduction significantly faster than principal component analysis and singular value decomposition. It uses projection matrix with zero-mean unit-variance random distribution and its error can be controlled easily. Tests on image data were executed recently to show distortion caused by projection. In this paper we present a measurement of precision and recall in vector model performed on real-life text data by comparison of results before and after the projection.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA101%2F02%2F0072" target="_blank" >GA101/02/0072: Analýza a řešení vybraných nelineárních úloh pružnosti metodou konečných prvků</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of IMAMM'03 conference
ISBN
—
ISSN
—
e-ISSN
—
Počet stran výsledku
8
Strana od-do
1-8
Název nakladatele
VŠB - Technická univerzita Ostrava
Místo vydání
Ostrava
Místo konání akce
Ostrava
Datum konání akce
1. 1. 2003
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—