Evaluation framework of hierarchical clustering methods for binary data
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F12%3A00062299" target="_blank" >RIV/00216224:14330/12:00062299 - isvavai.cz</a>
Výsledek na webu
<a href="http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6421371&isnumber=6421298" target="_blank" >http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6421371&isnumber=6421298</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/HIS.2012.6421371" target="_blank" >10.1109/HIS.2012.6421371</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Evaluation framework of hierarchical clustering methods for binary data
Popis výsledku v původním jazyce
The article aims to evaluate hierarchical clustering methods according to their performance for binary data type. We explore the accuracy of ten hierarchical clustering methods by experimenting with ten different distance measures. The three types of well, poorly and very poorly separated clusters of binary data sets are generated by selecting the appropriate parameters for binomial distribution and Monte Carlo method. In order to evaluate the precision of clustering methods the binary data sets are transformed to distance matrices. The error level each method is explored in relationship to distance measures, cluster types and data distributions. The Complete linkage, Flexible-beta and Ward´s methods have best clustering performance for the case of twowell separated clusters of binary data.
Název v anglickém jazyce
Evaluation framework of hierarchical clustering methods for binary data
Popis výsledku anglicky
The article aims to evaluate hierarchical clustering methods according to their performance for binary data type. We explore the accuracy of ten hierarchical clustering methods by experimenting with ten different distance measures. The three types of well, poorly and very poorly separated clusters of binary data sets are generated by selecting the appropriate parameters for binomial distribution and Monte Carlo method. In order to evaluate the precision of clustering methods the binary data sets are transformed to distance matrices. The error level each method is explored in relationship to distance measures, cluster types and data distributions. The Complete linkage, Flexible-beta and Ward´s methods have best clustering performance for the case of twowell separated clusters of binary data.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LA09016" target="_blank" >LA09016: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM)</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of 12th International Conference on Hybrid Intelligent Systems (HIS)
ISBN
9781467351140
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
421-426
Název nakladatele
IEEE
Místo vydání
Pune, India
Místo konání akce
Pune, India
Datum konání akce
4. 12. 2012
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—