Hierarchické modely pro detekci a popis anomalií
Cíle projektu
Detekce anomalií je důležitým nástrojem automatického zpracovaní dat v případech, kdy není u žádných dat známé, do jaké třídy patří (učení bez učitele). Detekce anomálií se snaží nalézt vzorky, které se výrazně liší od většiny a proto jsou potenciálně zajímavé pro další analýzu. V současné době je větsina metod založena na jednoduchých mělkých modelech bez jakékoliv složitější hierarchie. Oboru učení s učitelem, kde jsou k části vzorků známé třídy do kterých náleží, se složité modely s mnoha vrstvami složenými nad sebou ukázaly mnohem silnější než mělké modely. Cílem tohoto projektu je systematicky prozkoumat použití hlubokých modelů v detekci anomálií. Předpokládáme, že největší odlišností detekce anomalií je nutnost modelovat relativně řídké jevy, což je v přímém rozporu s oblasti učení s učitelem, který se snaží modelovat větsinu jevů. Jádrem práce tedy bude studium, kterak upravit modely tak, aby modelovaly časté a řídké jevy současně. Nalezené modely budeme prakticky ověřovat v oblastech síťové bezpečnosti a modelovaní plasmatu v Tokamaku.
Klíčová slova
anomaly detectionhierarchical modelsBayesian inferencedeep learningmulti-instance learning
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 22 (SGA0201800001)
Hlavní účastníci
Ústav teorie informace a automatizace AV ČR, v. v. i.
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
18-21409S
Alternativní jazyk
Název projektu anglicky
Hierarchical models for detection and description of anomalies
Anotace anglicky
Anomaly detection, which aims to identify samples very different from majority, is an important tool of unsupervised data analysis. Currently, most methods for anomaly detection use relatively simple shallow models without any complex layers and hierarchies. This is in sharp contrast to the area of supervised classification, where hierarchical models with large number of layers stacked on top of each other have proven to be more effective than shallow models. This project aims to partially fill this gap by proposing a systematic study of hierarchical models for anomaly detection from Bayesian and neural network perspectives. Since we conjecture that the main difference to supervised classification is the need to recognise rare samples, the core of the work focus on how to model frequent and rare samples simultaneously. Models developed during the project will be validated on anomaly detection problems in domains of network security and plasma discharges in Tokamak.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory
(dle převodníku)AF - Dokumentace, knihovnictví, práce s informacemi
BC - Teorie a systémy řízení
BD - Teorie informace
IN - Informatika
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Projekt splnil stanovené cíle, dosažené výsledky jsou v souladu s projektovým plánem a také relevantní záměru projektu, jejich počet i kvalita (několik výstupů v AIS:Q1) je na dobré úrovni. K čeprání prostředků nejsou žádné připomínky.
Termíny řešení
Zahájení řešení
1. 1. 2018
Ukončení řešení
31. 12. 2021
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
1. 4. 2021
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP22-GA0-GA-U
Datum dodání záznamu
29. 6. 2022
Finance
Celkové uznané náklady
9 663 tis. Kč
Výše podpory ze státního rozpočtu
8 862 tis. Kč
Ostatní veřejné zdroje financování
813 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
9 663 tis. Kč
Statní podpora
8 862 tis. Kč
91%
Poskytovatel
Grantová agentura České republiky
OECD FORD
Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Doba řešení
01. 01. 2018 - 31. 12. 2021