Stream4Flow: Software for mining and analysis of the large volumes of network traffic
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14610%2F16%3A00087653" target="_blank" >RIV/00216224:14610/16:00087653 - isvavai.cz</a>
Result on the web
<a href="https://github.com/CSIRT-MU/Stream4Flow" target="_blank" >https://github.com/CSIRT-MU/Stream4Flow</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Stream4Flow: Software for mining and analysis of the large volumes of network traffic
Original language description
A framework for the real-time IP flow data analysis built on Apache Spark Streaming, a modern distributed stream processing system. The basis of the Stream4Flow framework is formed by the IPFIXCol collector, Kafka messaging system, Apache Spark, and Elastic Stack. IPFIXCol enables incoming IP flow records to be transformed into the JSON format provided to the Kafka messaging system. The selection of Kafka was based on its scalability and partitioning possibilities, which provide sufficient data throughput. Apache Spark was selected as the data stream processing framework for its quick IP flow data throughput, available programming languages (Scala, Java, or Python) and MapReduce programming model. The analysis results are stored in Elastic Stack containing Logstash, Elasticsearch, and Kibana, which enable storage, querying, and visualizing the results.
Czech name
—
Czech description
—
Classification
Type
R - Software
CEP classification
IN - Informatics
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/TA04010062" target="_blank" >TA04010062: Technology for processing and analysis of network data in big data concept</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2016
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
Stream4Flow
Technical parameters
Stream4Flow je možné využít v odvětvích zabývajících se bezpečnostním monitorování počítačových sítí. Framework umožnuje přijmout, analyzovat a zobrazit výsledky analýz síťového provozu v reálném čase. Framewokr obsahuje aplikace, které umožnují detekovat různé druhy síťových útoků a vypočítávat základní charakteristiky o jednotlivých zařízeních v síti. Tyto aplikace je možné využít pro odhalení podezřelého chování zařízení v dlouhodobém horizontu či následně pro tvorbu reputace daného zařízení. Software je primárně distribuován mezi týmy zabývající se síťovou bezpečností, ale je možné ho využít i v jiných oblastech zabývajích se zpracováním velkého objemu dat. Kontaktní osoba: Mgr. Tomáš Jirsík Ústav výpočetní techniky, Masarykova Univerzita Botanická 68a, Brno 602 00 e-mail: jirsik@ics.muni.cz tel:+420 549 494 271
Economical parameters
Výsledek uspoří časové náklady nutné pro analýzu síťového provozu díky předpočítání charakteristik daného provozu a detekci. Dále ušetří personální kapacity z důvodu vytvoření platformy pro rychlé prototypování detekčních či analytických metod. Díky vhodně zvolenému typu licence mohou nástroj využít další subjekty zabývající se analýzou síťového provozu.
Owner IČO
00216224
Owner name
Masarykova Univerzita Botanická 68a, Brno 602 00