Vícerozměrná analýza dat metodami PCA, FA a CLU
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216275%3A25310%2F15%3A39900243" target="_blank" >RIV/00216275:25310/15:39900243 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Vícerozměrná analýza dat metodami PCA, FA a CLU
Popis výsledku v původním jazyce
Vícerozměrná statistická analýza je založena na latentních proměnných, které jsou lineární kombinací původních proměnných. Zdrojová matice dat obsahuje proměnné v m sloupcích a objekty v n řádcích. Data jsou před zpracováním škálována. Cílem je nalézt shluk jako množinu podobných objektů s podobnými proměnnými. Podobnost objektů posuzujeme na základě vzdálenosti (míry) objektů v m-rozměrném prostoru: čím je vzdálenost shluků či objektů větší, tím menší je jejich podobnost. Strukturu a vazby mezi proměnnými vystihují metody snížení dimensionality, metoda hlavních komponent (PCA). Důležitou pomůckou je rozptylový diagram, který zobrazuje objekty, rozptýlené v rovině prvních dvou hlavních komponent. Graf komponentních vah porovnává vzdálenosti mezi proměnnými xi a xj, kde krátká vzdálenost značí silnou korelaci. Dvojný graf pak kombinuje oba předchozí grafy. Objekty lze seskupovat do shluků hierarchicky dle předem zvoleného způsobu metriky (průměrově, centroidně, nejbližším sousedem, nejv
Název v anglickém jazyce
Multivariate data analysis methods PCA, FA and CLU
Popis výsledku anglicky
Multivariate statistical analysis is based on the latent variables and are linear combinations of the original variables, y = wx + ... + w 1 x1. Source data matrix of vm columns contains variables and objects are in lines. Data are before processing scaled. The goal is to find a cluster as a set of similar objects with similar variables. The similarity of objects are evaluated on distance (degrees) objects in m-dimensional space: the distance of clusters or objects is larger, the greater is their dissimilarity. Structure and relationships between variables describe methods of dimensionality reduction, principal component (PCA). An important tool is a scatter diagram showing the objects, dispersed in the plane of the first two principal components. Thegraph compares the component weights distances between variables xi and xj, where a short distance indicates a strong correlation. Biplot plot then combines the two previous graphs. Objects can be grouped into clusters according to the hi
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Zajištění kvality analytických výsledků: sborník příspěvků
ISBN
978-80-86380-75-9
ISSN
—
e-ISSN
—
Počet stran výsledku
21
Strana od-do
45-66
Název nakladatele
Ing. Václav Helán - 2 THETA
Místo vydání
Český Těšín
Místo konání akce
Lučina u Žermanické přehrady
Datum konání akce
24. 3. 2015
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—