Nahrazování chybějících dat a induktivní modelování
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F07%3A03132900" target="_blank" >RIV/68407700:21230/07:03132900 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Missing Data Imputation and the Inductive Modelling
Popis výsledku v původním jazyce
Missing data is a big problem in simulation for data mining and data analysis. Real world applications often contains missing data. Many data-mining methods is unable to create models from data which contains missing values. Traditional approach is to delete vectors with missing data. Unfortunately, this approach may lead to decreased accuracy of the models and in the worst case all data in dataset may be deleted. For this reason many different imputation techniques were developed and some are widely used. In this paper, we present a comparison of several well-known techniques for missing data imputation. Presented techniques includes imputation of mean value, zero, value from nearest input vector and few others. In this paper we show which techniquesare the best in estimation of missing values. To test imputation methods we used several different datasets. We compare the imputation methods in two ways. The first is to compare imputed data with original data.
Název v anglickém jazyce
Missing Data Imputation and the Inductive Modelling
Popis výsledku anglicky
Missing data is a big problem in simulation for data mining and data analysis. Real world applications often contains missing data. Many data-mining methods is unable to create models from data which contains missing values. Traditional approach is to delete vectors with missing data. Unfortunately, this approach may lead to decreased accuracy of the models and in the worst case all data in dataset may be deleted. For this reason many different imputation techniques were developed and some are widely used. In this paper, we present a comparison of several well-known techniques for missing data imputation. Presented techniques includes imputation of mean value, zero, value from nearest input vector and few others. In this paper we show which techniquesare the best in estimation of missing values. To test imputation methods we used several different datasets. We compare the imputation methods in two ways. The first is to compare imputed data with original data.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/KJB201210701" target="_blank" >KJB201210701: Automatická extrakce znalostí</a><br>
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 6th EUROSIM Congress on Modelling and Simulation
ISBN
978-3-901608-32-2
ISSN
—
e-ISSN
—
Počet stran výsledku
8
Strana od-do
—
Název nakladatele
ARGESIM
Místo vydání
Vienna
Místo konání akce
Ljubljana
Datum konání akce
9. 9. 2007
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—