Zlepšení klasifikace malwarových rodin pomocí naučené vzdálenosti pro nízké dimenze
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21240%2F22%3A00357682" target="_blank" >RIV/68407700:21240/22:00357682 - isvavai.cz</a>
Výsledek na webu
<a href="https://pad2021.fm.tul.cz/sbornik_files/PAD2021esbor.pdf" target="_blank" >https://pad2021.fm.tul.cz/sbornik_files/PAD2021esbor.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Zlepšení klasifikace malwarových rodin pomocí naučené vzdálenosti pro nízké dimenze
Popis výsledku v původním jazyce
V tomto článku se zabýváme vybranými state-of-the-art technikami pro učení vzdálenosti, které byly použity pro problém klasifikace malwarových rodin, přičemž se zaměřujeme na nízkodimenzionální reprezentace prostoru vstupních příznaků. Cílem algoritmů pro učení vzdálenosti je najít nejvhodnější parametry vzdálenosti s ohledem na dané optimalizační kritérium. Algoritmy pro učení vzdálenosti se v našem výzkumu učí z metadat obsažených v hlavičkách spustitelných souborů v souborovém formátu Portable Executable. Na naší datové sadě bylo provedeno několik experimentů se 14 000 vzorky sestávajícími ze šesti prevalentních malwarových rodin a benigních souborů. Experimentální výsledky ukázaly, že dobré klasifikační výsledky je možné dosáhnout už i pro dvojrozměrné vektory příznaků.
Název v anglickém jazyce
Improving Classification of Malware Families using a Learned Distance Metric for Low Dimensions
Popis výsledku anglicky
n this paper, we discuss selected state-of-the-art distance metric learning techniques that have been used for the malware family classification problem, focusing on low-dimensional representations of the input feature space. The goal of distance metric learning algorithms is to find the most suitable distance parameters with respect to a given optimization criterion. In our research, distance metric learning algorithms learn from the metadata contained in the executable file headers in the Portable Executable file format. Several experiments were performed on our dataset with 14,000 samples consisting of six prevalent malware families and benign files. Experimental results have shown that good classification results can be achieved even for two-dimensional symptom vectors.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Sborník příspěvků PAD 2021 Počítačové architektury & diagnostika
ISBN
978-80-7494-592-2
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
23-26
Název nakladatele
Technická univerzita v Liberci
Místo vydání
Liberec
Místo konání akce
online
Datum konání akce
12. 1. 2022
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—