Nonlinear random forest classification, a copula-based approach
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61988987%3A17610%2F21%3AA2202ABG" target="_blank" >RIV/61988987:17610/21:A2202ABG - isvavai.cz</a>
Výsledek na webu
<a href="https://www.mdpi.com/2076-3417/11/15/7140" target="_blank" >https://www.mdpi.com/2076-3417/11/15/7140</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.3390/app11157140" target="_blank" >10.3390/app11157140</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Nonlinear random forest classification, a copula-based approach
Popis výsledku v původním jazyce
In this work, we use a copula-based approach to select the most important features for a random forest classification. Based on associated copulas between these features, we carry out this feature selection. We then embed the selected features to a random forest algorithm to classify a label-valued outcome. Our algorithm enables us to select the most relevant features when the features are not necessarily connected by a linear function; also, we can stop the classification when we reach the desired level of accuracy. We apply this method on a simulation study as well as a real dataset of COVID-19 and for a diabetes dataset.
Název v anglickém jazyce
Nonlinear random forest classification, a copula-based approach
Popis výsledku anglicky
In this work, we use a copula-based approach to select the most important features for a random forest classification. Based on associated copulas between these features, we carry out this feature selection. We then embed the selected features to a random forest algorithm to classify a label-valued outcome. Our algorithm enables us to select the most relevant features when the features are not necessarily connected by a linear function; also, we can stop the classification when we reach the desired level of accuracy. We apply this method on a simulation study as well as a real dataset of COVID-19 and for a diabetes dataset.
Klasifikace
Druh
J<sub>imp</sub> - Článek v periodiku v databázi Web of Science
CEP obor
—
OECD FORD obor
10103 - Statistics and probability
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Applied Sciences
ISSN
2076-3417
e-ISSN
—
Svazek periodika
11
Číslo periodika v rámci svazku
15
Stát vydavatele periodika
CH - Švýcarská konfederace
Počet stran výsledku
11
Strana od-do
1-11
Kód UT WoS článku
000681844800001
EID výsledku v databázi Scopus
—