Generalized relative data and robustness in Bayes spaces
Project goals
“Relative data” refer to statistical data which are part of a whole, which is typically reflected in the reported data unit (mg/kg, ppm, %, etc.). The analysis of such data should not depend on the data scale, and this is made possible by the toolbox of “compositional data analysis”. However, nowadays there are more complex data structures: single observations are collected as probability density functions (PDFs), and even as PDFs of higher order, or they can be tables because of underlying factors. As with any other data, data quality issues appear in practice, because some variables or data ranges can only be measured with higher uncertainty, and because of data outliers affecting traditional data analyses. In this project we will use a framework where such generalized forms of relative data can be treated jointly, and where variable and/or observation weighting can be performed. The development of statistical methods under this framework will not only make it possible to analyse complex data structures, but such methods will also lead to an improved understanding of the results.
Keywords
compositional datacompositional tablesprobability density functionsfunctional datarobust statistics
Public support
Provider
Czech Science Foundation
Programme
—
Call for proposals
—
Main participants
Univerzita Palackého v Olomouci / Přírodovědecká fakulta
Contest type
M2 - International cooperation
Contract ID
22-15684L
Alternative language
Project name in Czech
Zobecněná relativní data a robustnost v Bayesových prostorech
Annotation in Czech
„Relativní data“ označují statistická data představující části celku, což je typicky reflektováno jednotkami uvedených dat (mg/kg, ppm, %, atd.). Analýza takovýchto dat by neměla záviset na jejich měřítku, což je umožněno přístupem „kompoziční analýzy dat“. Nicméně, v současnosti se vyskytují složitější datové struktury: jednotlivá pozorování představují hustoty rozdělení pravděpodobnosti, a dokonce mnohorozměrné hustoty, nebo tabulky odpovídající více faktorům. Jako je tomu u jiných dat, i v tomto případě se potýkáme s jejich kvalitou, neboť některé proměnné nebo části oboru hodnot mohou být měřeny pouze s vyšší úrovní nejistoty, a odlehlé hodnoty ovlivňují jejich tradiční datovou analýzu. V tomto projektu využijeme rámce, který umožní jednotný pohled na zobecněné podoby relativních dat, a kde můžeme provést vážení proměnných a/nebo pozorování. Rozvoj statistických metod v tomto rámci neumožní pouze analyzovat složité datové struktury, ale takové metody též povedou k lepšímu porozumění výsledkům analýzy.
Scientific branches
Solution timeline
Realization period - beginning
Jan 1, 2022
Realization period - end
Dec 31, 2024
Project status
—
Latest support payment
Jul 3, 2024
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP25-GA0-GF-R
Data delivery date
Mar 12, 2025
Finance
Total approved costs
3,693 thou. CZK
Public financial support
3,693 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
3 693 CZK thou.
Public support
3 693 CZK thou.
100%
Provider
Czech Science Foundation
OECD FORD
Applied mathematics
Solution period
01. 01. 2022 - 31. 12. 2024