Comparison of Controlled Undersampling Methods for Machine Learning
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F63839172%3A_____%2F24%3A10133704" target="_blank" >RIV/63839172:_____/24:10133704 - isvavai.cz</a>
Výsledek na webu
<a href="https://ieeexplore.ieee.org/document/10467755" target="_blank" >https://ieeexplore.ieee.org/document/10467755</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/ACDSA59508.2024.10467755" target="_blank" >10.1109/ACDSA59508.2024.10467755</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Comparison of Controlled Undersampling Methods for Machine Learning
Popis výsledku v původním jazyce
Data reduction is an important preprocessing operation for Machine Learning to learn from large datasets, especially in the case of applications requiring online learning using constrained resources. Our survey focuses on a specific family of data reduction methods - controlled undersampling methods. We observe the behaviour of the methods as they cooperate with several supervised machine-learning techniques over multiple evaluation datasets. Our results show that the random undersampling method offers surprisingly good results compared to more complex methods and is a good fit for online and resource-sensitive machine-learning applications.
Název v anglickém jazyce
Comparison of Controlled Undersampling Methods for Machine Learning
Popis výsledku anglicky
Data reduction is an important preprocessing operation for Machine Learning to learn from large datasets, especially in the case of applications requiring online learning using constrained resources. Our survey focuses on a specific family of data reduction methods - controlled undersampling methods. We observe the behaviour of the methods as they cooperate with several supervised machine-learning techniques over multiple evaluation datasets. Our results show that the random undersampling method offers surprisingly good results compared to more complex methods and is a good fit for online and resource-sensitive machine-learning applications.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2023054" target="_blank" >LM2023054: e-Infrastruktura CZ</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
International Conference on Artificial Intelligence, Computer, Data Sciences, and Applications, ACDSA 2024
ISBN
979-8-3503-9452-8
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
—
Název nakladatele
Institute of Electrical and Electronics Engineers Inc.
Místo vydání
Neuveden
Místo konání akce
Victoria, Seychelles
Datum konání akce
1. 2. 2024
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—