Robust Estimates in Generalized Linear Models
Result description
This thesis starts with description of exponential family of distributions folowed by the introduction to the theory of generalized linear models, a class of models widely used in many statistical applications. Next, maximum likelihood estimation (MLE) and its application to the estimation of parameters of a generalized linear model is described along with its advantages and disadvantages. One of these drawbacks is the sensitivity of MLE to contamination of observed data with outliers or leverage points. For this reason, our main attention is focused on description of robust methods that make an attempt to eliminate the influence of these extreme observations. We apply our mind to the description of robust estimator called median estimator which was developed for application to logistic regression models. This estimator is further generalized for models with geometric and Poisson distribution. The robustness of the estimator derived for Poisson models is studied extensively in several simulation experiments and compared with the robustness of an existing robust estimator named Mallows estimator. To compare the properties of median estimator with the method of maximum likelihood, the robustness of MLE is studied as well. The study shows that median estimator is more robust than the two other methods to the presence of outliers whereas its robustness is surpassed by Mallows estimator in estimation of data contaminated with leverage points. Additionally, one more simulation is performed to study the case where independency assumption of response variables is violated.
Keywords
Robust estimatorsmedian estimatorgeneralized linear modelsMallows estimator
The result's identifiers
Result code in IS VaVaI
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Robustní odhady v zobecnených lineárních modelech
Original language description
Na úvodních stranách této práce je ctenár uveden do teorie zobecnených lineárních modelu, což je trída modelu, které mají široké uplatnení v mnoha statistických aplikacích. V rámci definice zobecneného lineárního modelu je zaveden pojem exponenciální rodina spolu s príklady rozdelení, které do této rodiny patrí. Dále práce pojednává o metode maximální verohodnosti (MLE) — metode sloužící k odhadu parametru daného modelu, jejích výhodách i nedostatcích. Jedním z nedostatku metody maximální verohodnosti je její velká citlivost na prítomnost odlehlých pozorování v odhadovaných datech. Hlavní pozornost je proto venována robustním metodám, jejichž snahou je co nejvíce eliminovat vliv techto extrémních pozorování. Blíže popíšeme robustní odhad zvaný mediánový odhad, který byl vyvinut pro použití v modelu logistické regrese. Tento koncept je pak dále zobecnen na geometrický a Poissonuv regresní model. Robustnost odvozeného mediánového odhadu pro model poissonovské regrese studujeme v nekolika simulacních experimentech. Zároven jeho robustnost porovnáváme s již existujícím robustním odhadem poissonovských modelu zvaným Mallowsuv odhad a také s maximálne verohodným odhadem, abychom zjistili, jestli je mediánový odhad oproti MLE skutecne robustnejší. Ukazuje se, že mediánový odhad je robustnejší oproti zbylým dvema metodám v prípade vyšší úrovne zašumení odlehlými pozorováními (angl. outliery) a vetších rozsahu výberu. Pokud jsou data kontaminována vlivnými pozorováními (angl. leverage points), je nejvhodnejší použít Mallowsuv odhad. V dalším simulacním experimentu je pak zkoumán vliv porušení predpokladu nezávislosti vysvetlovaných promenných na kvalitu všech studovaných odhadu.
Czech name
Robustní odhady v zobecnených lineárních modelech
Czech description
Na úvodních stranách této práce je ctenár uveden do teorie zobecnených lineárních modelu, což je trída modelu, které mají široké uplatnení v mnoha statistických aplikacích. V rámci definice zobecneného lineárního modelu je zaveden pojem exponenciální rodina spolu s príklady rozdelení, které do této rodiny patrí. Dále práce pojednává o metode maximální verohodnosti (MLE) — metode sloužící k odhadu parametru daného modelu, jejích výhodách i nedostatcích. Jedním z nedostatku metody maximální verohodnosti je její velká citlivost na prítomnost odlehlých pozorování v odhadovaných datech. Hlavní pozornost je proto venována robustním metodám, jejichž snahou je co nejvíce eliminovat vliv techto extrémních pozorování. Blíže popíšeme robustní odhad zvaný mediánový odhad, který byl vyvinut pro použití v modelu logistické regrese. Tento koncept je pak dále zobecnen na geometrický a Poissonuv regresní model. Robustnost odvozeného mediánového odhadu pro model poissonovské regrese studujeme v nekolika simulacních experimentech. Zároven jeho robustnost porovnáváme s již existujícím robustním odhadem poissonovských modelu zvaným Mallowsuv odhad a také s maximálne verohodným odhadem, abychom zjistili, jestli je mediánový odhad oproti MLE skutecne robustnejší. Ukazuje se, že mediánový odhad je robustnejší oproti zbylým dvema metodám v prípade vyšší úrovne zašumení odlehlými pozorováními (angl. outliery) a vetších rozsahu výberu. Pokud jsou data kontaminována vlivnými pozorováními (angl. leverage points), je nejvhodnejší použít Mallowsuv odhad. V dalším simulacním experimentu je pak zkoumán vliv porušení predpokladu nezávislosti vysvetlovaných promenných na kvalitu všech studovaných odhadu.
Classification
Type
O - Miscellaneous
CEP classification
BB - Applied statistics, operational research
OECD FORD branch
—
Result continuities
Project
—
Continuities
S - Specificky vyzkum na vysokych skolach
Others
Publication year
2016
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Basic information
Result type
O - Miscellaneous
CEP
BB - Applied statistics, operational research
Year of implementation
2016