A comparison of procedures to select important variables for describing datasets
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68081731%3A_____%2F04%3A00109061" target="_blank" >RIV/68081731:_____/04:00109061 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
A comparison of procedures to select important variables for describing datasets
Original language description
Procrustes rotation is a powerful technique to select a minimum number of variables to characterize sets of objects. Here, Procrustes rotation was investigated with regard to either data preprocessing (autoscaling and žminoneŽ) or four different criteriato match the original and the reduced subspaces (i.e., for dropping out a vector from a data matrix). A well-known dataset which deals with morphologic descriptors of flying aphids was considered. In addition, a new procedure DROPCORA to look for variable selection was proposed and compared to the Procrustes one. It is based on evaluation of the correlation coefficients between vectors of matrix of variables. The number of selected variables was always equal to the number of important dimensions of thedataset. The variables selected in these ways differed and, so, robustness and multicollinearity were calculated. Considering both tests best results were obtained from the correlation matrix by procedure DROPCORA. Variable selection ...
Czech name
Srovnání algoritmů pro minimalizaci počtu proměnných popisujících soubor měření
Czech description
Prokrustova rotace je používána pro minimalizaci počtu proměnných nutných pro popis souboru objektů. Výsledný soubor proměnných podstatně závisí na použitém předzpracování naměřených dat. Multikolinearita a reprodukovatelnost výsledného souboru proměnných pro popis klasického souboru dat (létající mšice) byly testovány pro Prokrustovu rotaci s různým předzpracováním dat a pro dva nové algoritmy založené na korelaci a Fourierově transformaci. Nejlepší výsledky byly dosaženy pro algoritmus DROPCORA, založený na vyhodnocení korelační matice
Classification
Type
J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)
CEP classification
BD - Information theory
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/GA102%2F02%2F0553" target="_blank" >GA102/02/0553: The analysis and measurement of dynamic errors at acquisition systém</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2004
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Talanta
ISSN
0039-9140
e-ISSN
—
Volume of the periodical
63
Issue of the periodical within the volume
4
Country of publishing house
GB - UNITED KINGDOM
Number of pages
8
Pages from-to
865-872
UT code for WoS article
—
EID of the result in the Scopus database
—