Naučené indexy pro podobností hledání
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Mezinárodní grantové projekty hodnocené na principu LEAD Agency
Veřejná soutěž
—
Hlavní účastníci
Masarykova univerzita / Fakulta informatiky
Druh soutěže
M2 - Mezinárodní spolupráce
Číslo smlouvy
23-07040K
Alternativní jazyk
Název projektu anglicky
Learned Indexing for Similarity Searching
Anotace anglicky
When faced with the task of storing and retrieving complex, unstructured or high-dimensional data (e.g., multimedia data), metric spaces are often employed as an underlying mathematical concept for their organization. Consequently, the only measure that can be used to arrange the data is a pairwise similarity between data objects. Similarity searching refers to a range of methods used to manage data enabling efficient search in such spaces. The main paradigm of similarity searching has remained mostly unchanged for decades -- data objects are organized into a hierarchical structure according to their mutual distances, using representative pivots to reduce the number of distance computations needed to efficiently search the data. We plan to investigate an alternative to this paradigm, using machine learning models to replace pivots, thus, posing similarity search as a classification problem. We will use both supervised and unsupervised approaches to implement our solutions. We will also address the questions of scalability and dynamicity, and verify the applications for metric data.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika
Termíny řešení
Zahájení řešení
1. 7. 2023
Ukončení řešení
31. 12. 2026
Poslední stav řešení
B - Běžící víceletý projekt
Poslední uvolnění podpory
4. 7. 2023
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP24-GA0-GF-R
Datum dodání záznamu
19. 2. 2024
Finance
Celkové uznané náklady
7 634 tis. Kč
Výše podpory ze státního rozpočtu
6 900 tis. Kč
Ostatní veřejné zdroje financování
734 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč