Vývoj statistických neparametrických a divergencních metod pro zpracování dat z experimentu D0 a NOvA
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21340%2F16%3A00304786" target="_blank" >RIV/68407700:21340/16:00304786 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Vývoj statistických neparametrických a divergencních metod pro zpracování dat z experimentu D0 a NOvA
Popis výsledku v původním jazyce
Binární rozhodovací stromy jsou casto užívaným nástrojem pri klasifikaci vícerozmerných dat, napríklad v oblasti cásticové fyziky. Prezentujeme proto návrh nového binárního divergencního rozhodovacího stromu s ucitelem s vnorenou separacní metodou založenou na jádrových odhadech hustoty pravdepodobnosti. V každém uzlu stromu provádí vnorená metoda klasifikaci pouze na omezeném poctu vhodne vybraných fyzikálních promenných. Výber promenných je založen na maximalizaci divergencní míry mezi dvema separovanými trídami pozorování. Za úcelem trénování separace aplikujeme separacní strom na soubor Monte Carlo simulace dat pocházejících z cásticového urychlovace Tevatron pri experimentu DØ ve Fermilabu. Kvuli aplikaci metody na reálná data pak rovnež testujeme korektní selekci promenných v simulaci Monte Carlo a predstavíme modifikace testu pro vážené prvky v souborech pozorování.
Název v anglickém jazyce
Development of statistical nonparametric and divergence methods for data processing in D0 and NOvA experiments
Popis výsledku anglicky
Binary decision trees are a widely used tool for supervised classification of high-dimensional data, for example among particle physicists. We present our proposal of the supervised binary divergence decision tree with nested separation method based on kernel density estimation. A key insight we provide is the clustering driven only by a few selected physical variables. The proper selection consists of the variables achieving the maximal divergence measure between two different subclasses of data. Further we apply our method to Monte Carlo data set from the particle accelerator Tevatron at the DØ experiment in Fermilab. We also introduce the modification of statistical tests applicable to weighted data sets in order to test homogeneity of the Monte Carlo simulation and real data.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
BB - Aplikovaná statistika, operační výzkum
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů