Doplňování chybějících hodnot
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21110%2F12%3A00203559" target="_blank" >RIV/68407700:21110/12:00203559 - isvavai.cz</a>
Výsledek na webu
<a href="http://kix.fsv.cvut.cz/~kaiser/asw12_dchd" target="_blank" >http://kix.fsv.cvut.cz/~kaiser/asw12_dchd</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Doplňování chybějících hodnot
Popis výsledku v původním jazyce
Software slouží pro doplňování chybějících hodnot v datech obsahující kategoriální i spojité atributy. Je implementována metoda nejčastějšího výskytu a efektivnější algoritmus využívající kombinaci asociačních pravidel a metody nejčastějšího výskytu. Tato nová varianta algoritmu využívá i diskretizaci spojitých atributů a umožňuje i převedení nalezených kategorií zpět na číslené hodnoty. Takto je možné využít závislostí mezi kategoriálními i spojitými atributy a to pro odhad chybějících hodnot v kategoriálních i spojitých atributech. Software obsahuje rozsáhlou funkci na testování závislosti úspěšnosti doplnění chybějících hodnot na různém nastavení požadavku podpory asociačních pravidel.
Název v anglickém jazyce
Missing values imputation
Popis výsledku anglicky
Software is used for missing values imputation in data sets containing both categorical and continuous attributes. The method of the most common attribute value is implemented and a more effective algorithm using combination of association rules and mostcommon atribute value method is implemented. The new variant of the algorithm uses discretization of continuous attributes and allows conversion of imputed categories back to numeric values. This allows using dependencies among categorical and continuous attributes and may be used for missing values imputation in both categorical and continuous attributes. Function for testing the dependency of missing values imputation accuracy on requirement of minimal support of association rules is included.
Klasifikace
Druh
R - Software
CEP obor
BB - Aplikovaná statistika, operační výzkum
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
chhdn12
Technické parametry
Visual basic, MS Excel, Licenční podmínky na http://kix.fsv.cvut.cz/~kaiser/asw12_dchd
Ekonomické parametry
Ekonomický přínos závisí na důležitosti doplnění chybějících hodnot pro další analýzu dat a také na potřebě přesnosti doplněných hodnot a potřebě práce s datovými soubory s různou strukturou atributů. Lepší odhad chybějících hodnot může zamezit ztrátám vrozhodovacích procesech i v řádu desetitisíců nebo statisícu Kč.
IČO vlastníka výsledku
68407700
Název vlastníka
ČVUT FSv