All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Unsupervised learning from heterogenous structured data

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    SGA0202200004

  • Main participants

    České vysoké učení technické v Praze / Fakulta elektrotechnická

  • Contest type

    VS - Public tender

  • Contract ID

    22-32620S

Alternative language

  • Project name in Czech

    Učení bez učitele nad heterogenními strukturovanými daty

  • Annotation in Czech

    Informace uložené ve formě hierarchické struktury heterogenních záznamů jsou běžně používány v internetových službách (XML, JSON, etc.), ve finančnictví, zdravotnictví a jiných oblastech. Učení matematických modelů těchto dat je často nepřímé, založené na manuálně navržených příznacích. Nedávno jsme navrhli teoreticky podloženou metodu učení diskriminativního klasifikátoru do nějž vstupují přímo surová hierarchická data. Tato metodologie umožňuje vysvětlit rozhodnutí modelu pomocí podvýběru dat, které jsou za rozhodnutí zodpovědné. V rámci předloženého projektu navrhujeme rozříření této metodologie pro učení bez učitele. Metody učení bez učitele jsou použitelné na mnohem větší škálu aplikací, zahrnující detekci anomálií, shlukování nebo předtrénování, které zásadně změnilo oblast zpracování přirozeného jazyka. Konkrétně navrhujeme vyvinout věrohodnostní, generativní a approximativní pravděpodobnostní modely těchto dat a ověřit algoritmy na reálných datech z oblasti počítačové bezpečnosti a ověřování pravdivosti zpráv.

Scientific branches

  • R&D category

    ZV - Basic research

  • OECD FORD - main branch

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

  • OECD FORD - secondary branch

  • OECD FORD - another secondary branch

  • CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    AF - Documentation, librarianship, work with information<br>BC - Theory and management systems<br>BD - Information theory<br>IN - Informatics

Solution timeline

  • Realization period - beginning

    Jan 1, 2022

  • Realization period - end

    Dec 31, 2024

  • Project status

    K - Ending multi-year project

  • Latest support payment

    Mar 2, 2023

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP24-GA0-GA-R

  • Data delivery date

    Feb 19, 2024

Finance

  • Total approved costs

    10,686 thou. CZK

  • Public financial support

    10,686 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK