Bregman distances, divergences, and optimal algorithms for information retrieval, decisions and learning
Project goals
The research deals with the similarity criteria called Bregman distances and f-divergences and their applications in machine information processing. These criteria are so far applied in the praxis to discrete distributions, obtained often by rough quantizations in the feature spaces of database objects of complex functional nature such as spectral densities or various time-varying characteristics. The need to increase the optimality of used algorithms creates pressure on extension of application of these criteria to more complex distributions. This means in the first place to extend their definitions to more abstract spaces and to investigate the mathematical properties relevant for applications. The objectives of this project is precisely this step,namely the extension of both these criteria to arbitrary measurable densities not necessarily normalized to 1 and summarization of their mutual relations and properties for references in the process of application. A particular emphasis is on metric properties, relations to the classical information-theoretical and statistical concepts and demonstration of improved applicability in information retrieval, decision processes related to image and speech processing and machine learning.
Keywords
Bregmandistancesdivergencesdistributionsinformationretrievaloptimaldecisionsmachinelearning
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 13 (SGA02010GA-ST)
Main participants
—
Contest type
VS - Public tender
Contract ID
P202-10-0618
Alternative language
Project name in Czech
Bregmanovy vzdálenosti, divergence a optimální algoritmy pro hledání informací, rozhodování a učení
Annotation in Czech
Výzkum je zaměřen na kriteria shody známá jako Bregmanova vzdálenost a f-divergence a jejich aplikace ve strojovém zpracování informace. Obě kriteria jsou v praxi aplikována na diskrétní distribuce získané často pomocí razantního kvantování v prostorechsložitých příznaků databázových objektů, jako například spektrálních hustot nebo časově proměnných charakteristik. Snaha zvýšit optimálnost používaných algoritmů vytváří tlak na omezování informace ztracené při reprezentaci objektů. To vyžaduje aplikovatzmíněná kriteria na distribuce mnohem složitější povahy, což v prvé řadě vyžaduje rozšíření jejich definic na matematicky značně abstraktní prostory měřitelných hustot ne nutně normovaných k jedničce. Tento krok a prozkoumání vzájemných vztahů takto rozšířených obou kriterií a odvození jejich vlastností využitelných v procesu jejich aplikace tvoří hlavní předmět navrhovaného projektu. Důraz je kladen také na metrické vlastnosti obou charakteristik, na jejich vztahy ke klasickým informačně-teoretickým astatistickým pojmům a demonstraci zlepšených výsledků při hledání informací v databázích, při rozhodovacích procesech ve zpracování obrazu a řeči a ve strojovém učení.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
IN - Informatics
CEP - secondary branch
BD - Information theory
CEP - another secondary branch
JD - Use of computers, robotics and its application
10102 - Applied mathematics
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
20204 - Robotics and automatic control
20205 - Automation and control systems
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The principal investigator changed during the project. The goals of this project were fulfilled. The results were published in international journals and proceedings of international conferences.
Solution timeline
Realization period - beginning
Jan 1, 2010
Realization period - end
Dec 31, 2012
Project status
U - Finished project
Latest support payment
Apr 1, 2012
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP13-GA0-GA-U/02:3
Data delivery date
May 17, 2016
Finance
Total approved costs
1,050 thou. CZK
Public financial support
1,050 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Recognised costs
1 050 CZK thou.
Public support
1 050 CZK thou.
0%
Provider
Czech Science Foundation
CEP
IN - Informatics
Solution period
01. 01. 2010 - 31. 12. 2012