Prohledávání dokumentů ve vektorovém modelu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989100%3A27240%2F03%3A00008412" target="_blank" >RIV/61989100:27240/03:00008412 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Prohledávání dokumentů ve vektorovém modelu
Popis výsledku v původním jazyce
Information retrieval se mj. zabývá ukládáním a prohledáváním dokumentů. Vektorový model reprezentuje dokument jako vektor mnohorozmerného prostoru. Vetšina jeho implementací je bohužel efektivní jen pro malé dimenze, proto jsou hledány metody, jak dimenzi vektoru dokumentu snížit. V tomto článku ukazujeme jednu z možností # využití signatur (bitových řetězců pevné délky) které byly v boolovském modelu velmi efektivní. Druhou významnou skupinu metod tvorí indexování latentní sémantiky (LSI), jehož výpočetní náročnost je ovšem vysoká. Proto byla navržena rychlejší metoda náhodných projekcí, dobře zachovávající (při dostatečně velké redukované dimenzi) vzdálenosti a úhly mezi vektory. V článku zmíníme výsledky metody ve vektorovém modelu.
Název v anglickém jazyce
Document search in vector model
Popis výsledku anglicky
Information retrieval se mj. zabývá ukládáním a prohledáváním dokumentů. Vektorový model reprezentuje dokument jako vektor mnohorozmerného prostoru. Vetšina jeho implementací je bohužel efektivní jen pro malé dimenze, proto jsou hledány metody, jak dimenzi vektoru dokumentu snížit. V tomto článku ukazujeme jednu z možností # využití signatur (bitových řetězců pevné délky) které byly v boolovském modelu velmi efektivní. Druhou významnou skupinu metod tvorí indexování latentní sémantiky (LSI), jehož výpočetní náročnost je ovšem vysoká. Proto byla navržena rychlejší metoda náhodných projekcí, dobře zachovávající (při dostatečně velké redukované dimenzi) vzdálenosti a úhly mezi vektory. V článku zmíníme výsledky metody ve vektorovém modelu.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
sborníku semináře Wofex 2003
ISBN
—
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
266-271
Název nakladatele
VŠB - Technická univerzita Ostrava
Místo vydání
Ostrava
Místo konání akce
Ostrava
Datum konání akce
1. 1. 2003
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—