PPP-Codes: Similarity Search Index
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F13%3A00065750" target="_blank" >RIV/00216224:14330/13:00065750 - isvavai.cz</a>
Výsledek na webu
<a href="http://disa.fi.muni.cz/results/software/ppp-codes/" target="_blank" >http://disa.fi.muni.cz/results/software/ppp-codes/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
PPP-Codes: Similarity Search Index
Popis výsledku v původním jazyce
Many current applications need to organize data with respect to mutual similarity between data objects (for instance biometric systems). A typical general strategy to retrieve the most similar objects to a given example is to access and then refine a candidate set of objects; the overall search costs (and search time) then typically correlate with the candidate set size. The PPP-Codes index provides a generic approach that combines several independent indexes by aggregating their candidate sets in sucha way that the resulting candidate set can be one or two orders of magnitude smaller (while keeping the answer quality). This achievement comes at the expense of higher computational costs of the ranking algorithm but our experiments on various datasetsindicate that the overall gain can be significant, especially for data types with large objects or expensive similarity function such as biometric systems.
Název v anglickém jazyce
PPP-Codes: Similarity Search Index
Popis výsledku anglicky
Many current applications need to organize data with respect to mutual similarity between data objects (for instance biometric systems). A typical general strategy to retrieve the most similar objects to a given example is to access and then refine a candidate set of objects; the overall search costs (and search time) then typically correlate with the candidate set size. The PPP-Codes index provides a generic approach that combines several independent indexes by aggregating their candidate sets in sucha way that the resulting candidate set can be one or two orders of magnitude smaller (while keeping the answer quality). This achievement comes at the expense of higher computational costs of the ranking algorithm but our experiments on various datasetsindicate that the overall gain can be significant, especially for data types with large objects or expensive similarity function such as biometric systems.
Klasifikace
Druh
R - Software
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/VG20122015073" target="_blank" >VG20122015073: Efektivní vyhledávání v rozsáhlých biometrických datech</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
PPP-Codes
Technické parametry
Pro využití softwaru je nutné postupovat podle licence GNU GPL. Odpovědná osoba pro jednání: David Novák, Fakulta informatiky, Masarykova univerzita, Botanická 68a, Brno, 602 00, david.novak@fi.muni.cz, tel. 549495062
Ekonomické parametry
Software je využíván zejména vědeckou komunitou. Umožňuje vlastníkovi a jiným uživatelům vybudovat index pro podobnostní vyhledávání v různorodých datech na základě podobnosti. Index je navržen tak, aby silně redukoval kandidátní množinu vracených objektů a proto je velmi efektivní zejména pro datové typy s většími objekty nebo dražší podobnostní funkcí.
IČO vlastníka výsledku
00216224
Název vlastníka
Masarykova univerzita