Geometric aspects of mathematical statistics
Project goals
Nonparametric (NP) statistical methods are a toolbox of data analysis techniques, used when no simplifying assumptions can be imposed on the data generating process. Unlike for univariate data, no widely accepted unified approach to the NP analysis of multivariate datasets is available. We intend to study a major concept intensively discussed in statistics: data depth. Using depth, NP methods can be devised for multivariate data. The theory of depth is, however, severely underdeveloped. In preliminary research, we found that in advanced geometry, methods of striking similarity to data depth have been in use for decades. Those methods were developed independently of the research in statistics. We plan to explore these inter-disciplinary connections, and establish a solid base for the depth, and for the NP analysis of multivariate data. Our main aim is an eventual merge of multivariate statistics with parts of convex geometry. First off, the vast body of uncharted knowledge in geometry will be i) documented; ii) communicated; and iii) adapted to the statistical theory and practice.
Keywords
mathematical statisticsmultivariate statisticsfunctional data analysisconvex geometrydata depthfloating bodiesnon-parametric statisticsrobust statistical methods
Public support
Provider
Czech Science Foundation
Programme
Junior Grants
Call for proposals
Juniorské granty 5 (SGA0201900002)
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VS - Public tender
Contract ID
19-16097Y
Alternative language
Project name in Czech
Geometrické aspekty matematické statistiky
Annotation in Czech
Neparametrické (NP) metody matematické statistiky představují sadu technik používaných k analýze dat v situacích, kdy není možné přijmout žádné zjednodušující předpoklady o povaze procesu vzniku dat. Na rozdíl od jednorozměrných pozorování, pro mnohorozměrná data není k dispozici žádný obecně uznávaný jednotný přístup k NP statistice. Plánujeme studovat tzv. hloubku dat – důležitý statistický koncept, který umožňuje návrh NP metod pro mnohorozměrná data. Teorie související s hloubkou dat však není dostatečně rozvinutá. Náš předběžný výzkum ukázal, že geometrii jsou už po desetiletí využívány metody překvapivě podobné hloubce dat, vyvinuté nezávisle na výzkumu v matematické statistice. Plánujeme důkladně prozkoumat tyto souvislosti a využít je k položení pevných matematických základů jak pro hloubku, tak pro NP analýzu vícerozměrných dat. Naším hlavním cílem je sjednocení mnohorozměrné statistiky s částmi konvexní geometrie. V prvních krocích bude množství málo známých výsledků z geometrie i) zdokumentováno, ii) komunikováno, a iii) adaptováno statistické teorii a praxi.
Scientific branches
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
This is an outstanding project that established novel connections of the depth functions from mathematical statistics with the topics from geometry, which has been applied in multivariate nonparametric statistics. The results were published in 13 journal papers co-authored by leading experts in the field in the top journals such as J. Am. Stat. Assoc, Biometrika, J Comput Graph Stat.
Solution timeline
Realization period - beginning
Jan 1, 2019
Realization period - end
Dec 31, 2021
Project status
U - Finished project
Latest support payment
Apr 30, 2021
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP22-GA0-GJ-U
Data delivery date
Jun 29, 2022
Finance
Total approved costs
2,801 thou. CZK
Public financial support
2,801 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
2 801 CZK thou.
Public support
2 801 CZK thou.
100%
Provider
Czech Science Foundation
OECD FORD
Applied mathematics
Solution period
01. 01. 2019 - 31. 12. 2021