Porovnání kvality klasifikačních algoritmů v kontextu managementu znalostí
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F62690094%3A18450%2F01%3A6418" target="_blank" >RIV/62690094:18450/01:6418 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Porovnání kvality klasifikačních algoritmů v kontextu managementu znalostí
Popis výsledku v původním jazyce
Klasifikace prvků a výběr vhodného klasifikačního modelu jsou časté typy úloh, které jsou řešeny v rámci managementu znalostí. Doporučenou mírou kvality při klasifikaci do dvou skupin je ROC křivka. Konvexní obal ROCCH nad ROC křivkami jednotlivých klasifikačních algoritmů umožní sestavit hybridní klasifikační pravidlo, které je robustní s ohledem na změny pravděpodobností v zastoupení skupin a změny cen chybné klasifikace. Pro data z datového depozitáře je řešena možnost stanovení ROC a porovnání modelů lineární diskriminační funkce, logistické regrese a rozhodovacích stromů C&RT a CART. K odhadu prediktivní validity byl použit nezávislý testovací soubor. Modely byly sestaveny na učícím souboru o rozsahu 30162 prvků. Přesnost odhadnuta na testovacím souboru 15060 prvků. Bylo možno stanovit lokálně optimální klasifikační pravidla (logistická regrese a C&RT).
Název v anglickém jazyce
Comparison of Classification Algorithms in the Contect of Knowledge Management
Popis výsledku anglicky
Classification of items and selection the best classification models are very often solved in the frame of knowledge management tasks. ROC curve is reccomended as an available measure the quality of models in the two-groups classification problems. Convex hull ROCCH under ROC curves of different models was used for setting the classification rule that is robust to changes in probabilities of both groups and (or) changes in missclassification costs. ROC curves of linear discriminant function, logistic regression, C&RT and QUEST models were compared on data from data repository. Estimate of predictive validity was based on independent test sample. Sample sizes were 30162 and 15060 respectively for training and test samples.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
BB - Aplikovaná statistika, operační výzkum
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2001
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Znalosti 2001
ISBN
80-245-0190-2
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
274-279
Název nakladatele
VŠE Praha
Místo vydání
Praha
Místo konání akce
Praha
Datum konání akce
1. 1. 2001
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—