All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Efficient subgraph discovery for petabyte-scale web analysis

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    Standardní projekty 19 (SGA0201500001)

  • Main participants

    CISCO SYSTEMS (Czech Republic) s.r.o.<br>Univerzita Karlova / Matematicko-fyzikální fakulta

  • Contest type

    VS - Public tender

  • Contract ID

    15-08916S

Alternative language

  • Project name in Czech

    Efektivní identifikace podgrafů při analýze webových grafů velikosti petabajtů

  • Annotation in Czech

    Studium chování uživatelů v síti bez možnosti zkoumat vlastní obsah paketů se stává důležitým tématem pro výzkum síťové administrace a zejména bezpečnosti. V uplynulých letech vzrostla poptávka po algoritmech strojového učení na grafech, jelikož právě grafy jsou pro modelování interakcí mezi entitami v počítačové síti tím přirozeným formalismem. Slibným přístupem k modelování grafů pro potřeby strojového učení se ukazují být tzv. graflety, které umožňují transformovat grafové fragmenty (podgrafy, uzly) do euklidovského prostoru. Bohužel, v současné podobě je použití grafletů omezeno jednak vysokými náklady na zmíněnou transformaci, jednak jsou použitelné pouze na neorientované a nevážené grafy. V tomto projektu se zaměřujeme na zobecnění grafletového modelu (a grafletových slovníků) pro rozšíření množiny aplikací, kde mohou být z grafletů odvozené deskriptory úspěšně použity. Navržená metodologie bude verifikována v doméně síťové bezpečnosti - konkrétně budou odhalovány škodlivé webové komunity - a to na databázi síťového provozu velikosti v řádu petabajtů poskytnuté firmou Cisco.

Scientific branches

  • R&D category

    ZV - Basic research

  • CEP classification - main branch

    IN - Informatics

  • CEP - secondary branch

  • CEP - another secondary branch

  • OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Completed project evaluation

  • Provider evaluation

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Project results evaluation

    The project results are consistent with the original project proposal and are focused on extracting information in large data networks. The main benefit of the project is the design and implementation of methods and models that can be used in a real Internet environment. The results were published in quality journals and presented at conferences. The objectives of the project were fulfilled.

Solution timeline

  • Realization period - beginning

    Jan 1, 2015

  • Realization period - end

    Dec 31, 2017

  • Project status

    U - Finished project

  • Latest support payment

    May 16, 2017

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP18-GA0-GA-U/02:1

  • Data delivery date

    May 4, 2018

Finance

  • Total approved costs

    4,386 thou. CZK

  • Public financial support

    4,386 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK