DataZoo: Streamlining Traffic Classification Experiments
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F63839172%3A_____%2F23%3A10133608" target="_blank" >RIV/63839172:_____/23:10133608 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/68407700:21240/23:00370023
Výsledek na webu
<a href="https://dl.acm.org/doi/pdf/10.1145/3630050.3630176" target="_blank" >https://dl.acm.org/doi/pdf/10.1145/3630050.3630176</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1145/3630050.3630176" target="_blank" >10.1145/3630050.3630176</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
DataZoo: Streamlining Traffic Classification Experiments
Popis výsledku v původním jazyce
The machine learning communities, such as those around computer vision or natural language processing, have developed numerous supportive tools and benchmark datasets to accelerate the development. In contrast, the network traffic classification field lacks standard benchmark datasets for most tasks, and the available supportive software is rather limited in scope. This paper aims to address the gap and introduces DataZoo, a toolset designed to streamline dataset management in network traffic classification. DataZoo provides a standardized API for accessing three extensive datasets--CESNET-QUIC22, CESNET-TLS22, and CESNET-TLS-YEAR22. Moreover, it includes methods for feature scaling and realistic dataset partitioning, taking into consideration temporal and service-related factors. The DataZoo toolset simplifies the creation of realistic evaluation scenarios, making it easier to cross-compare classification methods and reproduce results.
Název v anglickém jazyce
DataZoo: Streamlining Traffic Classification Experiments
Popis výsledku anglicky
The machine learning communities, such as those around computer vision or natural language processing, have developed numerous supportive tools and benchmark datasets to accelerate the development. In contrast, the network traffic classification field lacks standard benchmark datasets for most tasks, and the available supportive software is rather limited in scope. This paper aims to address the gap and introduces DataZoo, a toolset designed to streamline dataset management in network traffic classification. DataZoo provides a standardized API for accessing three extensive datasets--CESNET-QUIC22, CESNET-TLS22, and CESNET-TLS-YEAR22. Moreover, it includes methods for feature scaling and realistic dataset partitioning, taking into consideration temporal and service-related factors. The DataZoo toolset simplifies the creation of realistic evaluation scenarios, making it easier to cross-compare classification methods and reproduce results.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20202 - Communication engineering and systems
Návaznosti výsledku
Projekt
<a href="/cs/project/VJ02010024" target="_blank" >VJ02010024: Analýza šifrovaného provozu pomocí síťových toků</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
SAFE '23: Proceedings of the 2023 on Explainable and Safety Bounded, Fidelitous, Machine Learning for Networking
ISBN
979-8-4007-0449-9
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
3-7
Název nakladatele
ACM
Místo vydání
New York
Místo konání akce
Paříž, Francie
Datum konání akce
5. 12. 2023
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—