Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Prohledávání dokumentů ve vektorovém modelu

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989100%3A27240%2F03%3A00008412" target="_blank" >RIV/61989100:27240/03:00008412 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Prohledávání dokumentů ve vektorovém modelu

  • Popis výsledku v původním jazyce

    Information retrieval se mj. zabývá ukládáním a prohledáváním dokumentů. Vektorový model reprezentuje dokument jako vektor mnohorozmerného prostoru. Vetšina jeho implementací je bohužel efektivní jen pro malé dimenze, proto jsou hledány metody, jak dimenzi vektoru dokumentu snížit. V tomto článku ukazujeme jednu z možností # využití signatur (bitových řetězců pevné délky) které byly v boolovském modelu velmi efektivní. Druhou významnou skupinu metod tvorí indexování latentní sémantiky (LSI), jehož výpočetní náročnost je ovšem vysoká. Proto byla navržena rychlejší metoda náhodných projekcí, dobře zachovávající (při dostatečně velké redukované dimenzi) vzdálenosti a úhly mezi vektory. V článku zmíníme výsledky metody ve vektorovém modelu.

  • Název v anglickém jazyce

    Document search in vector model

  • Popis výsledku anglicky

    Information retrieval se mj. zabývá ukládáním a prohledáváním dokumentů. Vektorový model reprezentuje dokument jako vektor mnohorozmerného prostoru. Vetšina jeho implementací je bohužel efektivní jen pro malé dimenze, proto jsou hledány metody, jak dimenzi vektoru dokumentu snížit. V tomto článku ukazujeme jednu z možností # využití signatur (bitových řetězců pevné délky) které byly v boolovském modelu velmi efektivní. Druhou významnou skupinu metod tvorí indexování latentní sémantiky (LSI), jehož výpočetní náročnost je ovšem vysoká. Proto byla navržena rychlejší metoda náhodných projekcí, dobře zachovávající (při dostatečně velké redukované dimenzi) vzdálenosti a úhly mezi vektory. V článku zmíníme výsledky metody ve vektorovém modelu.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

    JC - Počítačový hardware a software

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    Z - Vyzkumny zamer (s odkazem do CEZ)

Ostatní

  • Rok uplatnění

    2003

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    sborníku semináře Wofex 2003

  • ISBN

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    6

  • Strana od-do

    266-271

  • Název nakladatele

    VŠB - Technická univerzita Ostrava

  • Místo vydání

    Ostrava

  • Místo konání akce

    Ostrava

  • Datum konání akce

    1. 1. 2003

  • Typ akce podle státní příslušnosti

    CST - Celostátní akce

  • Kód UT WoS článku