Odlehlé objekty a shlukovací algoritmy
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F44555601%3A13510%2F09%3A00005325" target="_blank" >RIV/44555601:13510/09:00005325 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Odlehlé objekty a shlukovací algoritmy
Popis výsledku v původním jazyce
Příspěvek se zabývá problematikou odlehlých objektů ve shlukové analýze. Cílem práce bylo zmapovat možnosti jejich detekce. V článku jsou popsány a porovnány dvě alternativy algoritmu k-průměrů umožňující odhalení odlehlých objektů. Obě metody jsou postaveny na principu různých typů stromů. Jednou z variant je dvoufázová metoda shlukování, která v první fázi využívá modifikovaného algoritmu k-průměrů a v druhé fázi za pomoci minimální kostry odhalí odlehlé objekty a vytvoří cílové rozdělení do požadovaných k shluků. Druhá z variant je vlastní modifikací. Při programování algoritmu jsem se nechala motivovat známým algoritmem využívajícím mrkd-stromy. Pro odhalení odlehlých objektů jsem využila nerobustnosti aritmetického průměru.
Název v anglickém jazyce
Outliers and cluster algorithms
Popis výsledku anglicky
The paper deals with the problem of outliers in the cluster analysis. The aim of this work was to map out the possibilities for their detection. The article described and compared two alternatives of algorithm k-means to enable the detection of outliers.Both methods are based on the principle of different types of trees. One variant is a two-phase clustering method, which in the first phase uses a modified k-means algorithm and the second phase, with the help of a minimum spanning tree reveals outliersand create a target distribution in clusters. The second variant is a modification of its own. I had to motivate a well-known algorithm using mrkd-trees. For the detection of outliers I use non-robustness of mean.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
BB - Aplikovaná statistika, operační výzkum
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
V - Vyzkumna aktivita podporovana z jinych verejnych zdroju
Ostatní
Rok uplatnění
2009
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Mezinárodní statisticko-ekonomické dny na VŠE
ISBN
978-80-86175-66-9
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
—
Název nakladatele
VŠE Praha
Místo vydání
Praha
Místo konání akce
Praha
Datum konání akce
17. 9. 2009
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—