Efficient subgraph discovery for petabyte-scale web analysis
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 19 (SGA0201500001)
Main participants
CISCO SYSTEMS (Czech Republic) s.r.o.<br>Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VS - Public tender
Contract ID
15-08916S
Alternative language
Project name in Czech
Efektivní identifikace podgrafů při analýze webových grafů velikosti petabajtů
Annotation in Czech
Studium chování uživatelů v síti bez možnosti zkoumat vlastní obsah paketů se stává důležitým tématem pro výzkum síťové administrace a zejména bezpečnosti. V uplynulých letech vzrostla poptávka po algoritmech strojového učení na grafech, jelikož právě grafy jsou pro modelování interakcí mezi entitami v počítačové síti tím přirozeným formalismem. Slibným přístupem k modelování grafů pro potřeby strojového učení se ukazují být tzv. graflety, které umožňují transformovat grafové fragmenty (podgrafy, uzly) do euklidovského prostoru. Bohužel, v současné podobě je použití grafletů omezeno jednak vysokými náklady na zmíněnou transformaci, jednak jsou použitelné pouze na neorientované a nevážené grafy. V tomto projektu se zaměřujeme na zobecnění grafletového modelu (a grafletových slovníků) pro rozšíření množiny aplikací, kde mohou být z grafletů odvozené deskriptory úspěšně použity. Navržená metodologie bude verifikována v doméně síťové bezpečnosti - konkrétně budou odhalovány škodlivé webové komunity - a to na databázi síťového provozu velikosti v řádu petabajtů poskytnuté firmou Cisco.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
IN - Informatics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project results are consistent with the original project proposal and are focused on extracting information in large data networks. The main benefit of the project is the design and implementation of methods and models that can be used in a real Internet environment. The results were published in quality journals and presented at conferences. The objectives of the project were fulfilled.
Solution timeline
Realization period - beginning
Jan 1, 2015
Realization period - end
Dec 31, 2017
Project status
U - Finished project
Latest support payment
May 16, 2017
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP18-GA0-GA-U/02:1
Data delivery date
May 4, 2018
Finance
Total approved costs
4,386 thou. CZK
Public financial support
4,386 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK