Distribuované zpracování a analýza dat ze sociálních sítí - Návrh a implementace distribuované architektury
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F18%3APU135245" target="_blank" >RIV/00216305:26230/18:PU135245 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.fit.vut.cz/research/publication/11883/" target="_blank" >https://www.fit.vut.cz/research/publication/11883/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Distribuované zpracování a analýza dat ze sociálních sítí - Návrh a implementace distribuované architektury
Popis výsledku v původním jazyce
Současné metody rekonstrukce a forenzní analýzy aktivity uživatelů se zaměřují prakticky výhradně na analýzu lokáních počítačů. Stále rostoucí popularita sociálních sítí ale způsobuje, že se stále více aktivit přesouvá právě na sociální sítě. Je proto nezbytné rozšířit analyzovanou časovou osu i o informace o aktivitách na sociálních sítích. V takovém případě je však nutné analyzovat velké množství zdrojů (např. profilů na sociálních sítích) a tedy získat a dále zpracovat velké množství dat. Je tedy nutné navrhnout škálovatelné řešení jak pro získávání, tak pro další analýzu dat ze sociálních sítí. V této technické zprávě se zaměřujeme na analýzu existujících modelů časové osy, existujících souvisejících softwarových řešení pro distribuované zpracování velkého množství dat a zejména na návrh architektury nástroje pro rekonstrukci a analýzu časové osy v distribuovaném prostředí. Rovněž se zabýváme implementací navrženého nástroje na platformě Apache Hadoop.
Název v anglickém jazyce
Distributed Processing and Analysis of the Social Network Data - Design and Implementation of a Distributed Architecture
Popis výsledku anglicky
Current methods of reconstruction and forensic analysis of user activity focus almost exclusively on local computer analysis. However, the increasing popularity of social networks causes more and more activities to be transferred to social networks. It is therefore necessary to extend the analyzed timeline to include information on activities on social networks. In such a case, however, it is necessary to analyze a large amount of resources (e.g. social network profiles) and thus obtain and further process a large amount of data. It is therefore necessary to propose a scalable solution for both acquiring and further analyzing social network data. In this technical report, we focus on analyzing existing timeline models, existing related software solutions for distributed large amounts of data processing, and in particular the design of a tool for reconstructing and analyzing timeline in a distributed environment. We also deal with the implementation of the proposed tool on the Apache Hadoop
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/VI20172020062" target="_blank" >VI20172020062: Integrovaná platforma pro zpracování digitálních dat z bezpečnostních incidentů (TARZAN)</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů