Statistické zpracování vodohospodářských dat 6. Vícerozměrná klasifikace zdrojů pitné vody metodou hlavních komponent PCA a shluků CLU
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216275%3A25310%2F07%3A00006248" target="_blank" >RIV/00216275:25310/07:00006248 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Statistické zpracování vodohospodářských dat 6. Vícerozměrná klasifikace zdrojů pitné vody metodou hlavních komponent PCA a shluků CLU
Popis výsledku v původním jazyce
Vícerozměrná statistická analýza je založena na latentních proměnných, které jsou lineární kombinací původních proměnných, y = w1 x1+...+wm xm . Zdrojová matice dat obsahuje proměnné v m sloupcích a objekty v n řádcích. Data jsou před zpracováním škálována. Cílem je nalézt shluk jako množinu podobných objektů s podobnými proměnnými. Podobnost objektů posuzujeme na základě vzdálenosti (míry) objektů v m-rozměrném prostoru: čím je vzdálenost shluků či objektů větší, tím menší je jejich podobnost. Strukturu a vazby mezi proměnnými vystihují metody snížení dimensionality, metoda hlavních komponent (PCA). Důležitou pomůckou je rozptylový diagram, který zobrazuje objekty, rozptýlené v rovině prvních dvou hlavních komponent. Graf komponentních vah porovnává vzdálenosti mezi proměnnými xi a xj, kde krátká vzdálenost značí silnou korelaci. Dvojný graf pak kombinuje oba předchozí grafy. Objekty lze seskupovat do shluků hierarchicky dle předem zvoleného způsobu metriky (průměrově, centroidně, nej
Název v anglickém jazyce
Computer-Assisted Statistical Data Analysis. 6. Multivariate Classification of Various Sources of Drinkable Water using Principal Component Analysis and Cluster Analysis
Popis výsledku anglicky
Multivariate statistical analysis is based on the latent variables which are formed as the linear combination of original variables y = w1 x1+...+wm xm . Data matrix contains objects in n rows and m columns. Before data treatment the data are scaled. Similarity of objects and variables is considered on base on Mahalonobis distance or Euclidean distance in the mdimensional space. The principal components analysis reduces dimensionality and presents objects in two or three dimensions. The plot of components weight shows hidden structure among variables while the scatterplot shows the hidden structure of objects. The cluster analysis leads to clusters which may be plotted in dendrogram. There are two dendrograms available, the dendrogram of variables andthe dendrogram of objects. Both statistical techniques are demonstrated on the analysis and classification of various sources of a drinkable water.
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
CB - Analytická chemie, separace
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Vodní hospodářství
ISSN
1211-0760
e-ISSN
—
Svazek periodika
57
Číslo periodika v rámci svazku
8
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
8
Strana od-do
289-296
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—