Recognition of whether the data stream is compressed or encrypted: literature search and experimental evaluation of available techniques
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F18%3A00328008" target="_blank" >RIV/68407700:21230/18:00328008 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Rozpoznávání, zda je datový tok komprimovaný, nebo šifrovaný: rešerše literatury a experimentální vyhodnocení dostupných technik
Original language description
V naší práci se snažíme rozpoznat, zda vstupní datový tok je běžným souborem (příp. jeho fragmentem), nebo se jedná o šifrovaný datový tok, nebo komprimovaný datový tok, respektive jejich fragment. Jelikož nám zatím nebyla dodána data z praxe, v námi vyvinutém frameworku pro pracovní účely zatím jako běžný datový tok používáme soubory obrázků (BMP, JPEG - STL10 dataset) a běžný text (korpusy knihovny NLTK). Co se týče šifrovacích algoritmů, lze jednoduše doplnit jakékoliv implementace z knihovny PyCryptoDome, ovšem bylo by schůdné rozšířit možnosti o jakoukoliv další implementaci šifrování v jazyce Python. Pro jednoduchost jsme se v dosavadních experimentech omezili na šifrovací metody AES/ECB a RSA. Jako kompresní algoritmy uvažujeme: gzip, bzip2 a lzma.
Czech name
Rozpoznávání, zda je datový tok komprimovaný, nebo šifrovaný: rešerše literatury a experimentální vyhodnocení dostupných technik
Czech description
V naší práci se snažíme rozpoznat, zda vstupní datový tok je běžným souborem (příp. jeho fragmentem), nebo se jedná o šifrovaný datový tok, nebo komprimovaný datový tok, respektive jejich fragment. Jelikož nám zatím nebyla dodána data z praxe, v námi vyvinutém frameworku pro pracovní účely zatím jako běžný datový tok používáme soubory obrázků (BMP, JPEG - STL10 dataset) a běžný text (korpusy knihovny NLTK). Co se týče šifrovacích algoritmů, lze jednoduše doplnit jakékoliv implementace z knihovny PyCryptoDome, ovšem bylo by schůdné rozšířit možnosti o jakoukoliv další implementaci šifrování v jazyce Python. Pro jednoduchost jsme se v dosavadních experimentech omezili na šifrovací metody AES/ECB a RSA. Jako kompresní algoritmy uvažujeme: gzip, bzip2 a lzma.
Classification
Type
V<sub>souhrn</sub> - Summary research report
CEP classification
—
OECD FORD branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Result continuities
Project
<a href="/en/project/OWCVUT2018001" target="_blank" >OWCVUT2018001: COE - Rezognize whether the analyzed data stream is compressed or encrypted</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2018
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Number of pages
12
Place of publication
Praha
Publisher/client name
Ministerstvo obrany České republiky
Version
—