Learned metric index - proposition of learned indexing for unstructured data
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F21%3A00118915" target="_blank" >RIV/00216224:14330/21:00118915 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1016/j.is.2021.101774" target="_blank" >http://dx.doi.org/10.1016/j.is.2021.101774</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1016/j.is.2021.101774" target="_blank" >10.1016/j.is.2021.101774</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Learned metric index - proposition of learned indexing for unstructured data
Popis výsledku v původním jazyce
The main paradigm of similarity searching in metric spaces has remained mostly unchanged for decades - data objects are organized into a hierarchical structure according to their mutual distances, using representative pivots to reduce the number of distance computations needed to efficiently search the data. We propose an alternative to this paradigm, using machine learning models to replace pivots, thus posing similarity search as a classification problem, which stands in for numerous expensive distance computations. Even a relatively naive implementation of this idea is more than competitive with state-of-the-art methods in terms of speed and recall, proving the concept as viable and showing great potential for its future development.
Název v anglickém jazyce
Learned metric index - proposition of learned indexing for unstructured data
Popis výsledku anglicky
The main paradigm of similarity searching in metric spaces has remained mostly unchanged for decades - data objects are organized into a hierarchical structure according to their mutual distances, using representative pivots to reduce the number of distance computations needed to efficiently search the data. We propose an alternative to this paradigm, using machine learning models to replace pivots, thus posing similarity search as a classification problem, which stands in for numerous expensive distance computations. Even a relatively naive implementation of this idea is more than competitive with state-of-the-art methods in terms of speed and recall, proving the concept as viable and showing great potential for its future development.
Klasifikace
Druh
J<sub>imp</sub> - Článek v periodiku v databázi Web of Science
CEP obor
—
OECD FORD obor
10200 - Computer and information sciences
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Information Systems
ISSN
0306-4379
e-ISSN
—
Svazek periodika
100
Číslo periodika v rámci svazku
101774
Stát vydavatele periodika
NL - Nizozemsko
Počet stran výsledku
12
Strana od-do
1-12
Kód UT WoS článku
000649115200005
EID výsledku v databázi Scopus
2-s2.0-85104454116