Learned Indexing for Similarity Searching
Public support
Provider
Czech Science Foundation
Programme
—
Call for proposals
—
Main participants
Masarykova univerzita / Fakulta informatiky
Contest type
M2 - International cooperation
Contract ID
23-07040K
Alternative language
Project name in Czech
Naučené indexy pro podobností hledání
Annotation in Czech
Vyhledávání v datech, která jsou nestrukturovaná, komplexní nebo vysoce dimenzionální (např. multimediální data), je často řešeno pomocí metrických prostorů, jakožto základního matematického aparátu pro zpracování dat. Jediným měřítkem, které zde lze k uspořádání dat použít, je podobnost mezi dvojicí datových objektů. Hlavní paradigma podobnostního vyhledávání zůstalo po celá desetiletí většinou původní: datové objekty jsou organizovány do hierarchické struktury s ohledem na jejich vzájemné vzdálenosti a efektivita vyhledávání je zajištěna odfiltrováním nerelevantních dat pomocí předvybraných reprezentantů (pivotů), tj. minimalizací počtu výpočtů vzdálenosti. V tomto projektu budeme zkoumat alternativní přístup k podobnostnímu vyhledávání: použití modelů strojového učení jako náhrady pivotů, tj. realizace podobnostního vyhledávání jako klasifikační problém. Zabývat se budeme jak technikami učení s učitelem, tak i bez učitele. Rovněž budeme řešit otázky škálovatelnosti a dynamičnosti přístupů a ověřovat je na vhodných aplikacích.
Scientific branches
R&D category
ZV - Basic research
OECD FORD - main branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - secondary branch
—
OECD FORD - another secondary branch
—
CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
AF - Documentation, librarianship, work with information<br>BC - Theory and management systems<br>BD - Information theory<br>IN - Informatics
Solution timeline
Realization period - beginning
Jul 1, 2023
Realization period - end
Dec 31, 2026
Project status
B - Running multi-year project
Latest support payment
Jul 4, 2023
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP24-GA0-GF-R
Data delivery date
Feb 19, 2024
Finance
Total approved costs
7,634 thou. CZK
Public financial support
6,900 thou. CZK
Other public sources
734 thou. CZK
Non public and foreign sources
0 thou. CZK