Unmasking the Phishermen: Phishing Domain Detection with Machine Learning and Multi-Source Intelligence
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F24%3APU149927" target="_blank" >RIV/00216305:26230/24:PU149927 - isvavai.cz</a>
Výsledek na webu
<a href="https://ieeexplore.ieee.org/document/10575573" target="_blank" >https://ieeexplore.ieee.org/document/10575573</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/NOMS59830.2024.10575573" target="_blank" >10.1109/NOMS59830.2024.10575573</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Unmasking the Phishermen: Phishing Domain Detection with Machine Learning and Multi-Source Intelligence
Popis výsledku v původním jazyce
In the digital landscape, phishing attacks have rapidly evolved into a major cybersecurity challenge, posing significant risks to individuals and organizations. This short paper presents our preliminary research on detecting phishing domains. Our approach amalgamates intelligence from multiple sources: DNS servers, WHOIS/RDAP, TLS certificates, and GeoIP data. We created a rich 15.8 GB dataset of information about benign and phishing domains, from which we derived a comprehensive 80-feature vector for training and testing machine learning classifiers. We propose preliminary results with a fine-tuned XGBoost model, achieving 0.9716 precision rate, 0.9540 F-1 score, and false positive rate of 0.23%.
Název v anglickém jazyce
Unmasking the Phishermen: Phishing Domain Detection with Machine Learning and Multi-Source Intelligence
Popis výsledku anglicky
In the digital landscape, phishing attacks have rapidly evolved into a major cybersecurity challenge, posing significant risks to individuals and organizations. This short paper presents our preliminary research on detecting phishing domains. Our approach amalgamates intelligence from multiple sources: DNS servers, WHOIS/RDAP, TLS certificates, and GeoIP data. We created a rich 15.8 GB dataset of information about benign and phishing domains, from which we derived a comprehensive 80-feature vector for training and testing machine learning classifiers. We propose preliminary results with a fine-tuned XGBoost model, achieving 0.9716 precision rate, 0.9540 F-1 score, and false positive rate of 0.23%.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/VJ02010024" target="_blank" >VJ02010024: Analýza šifrovaného provozu pomocí síťových toků</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of IEEE/IFIP Network Operations and Management Symposium 2024
ISBN
979-8-3503-2794-6
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
1-5
Název nakladatele
Institute of Electrical and Electronics Engineers
Místo vydání
Soul
Místo konání akce
Soul
Datum konání akce
6. 5. 2024
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
001270140300140