Vše
Vše

Co hledáte?

Vše
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Predikce vlastností bílkovin prostorovým statistickým relačním strojovým učením

Cíle projektu

Proteiny (bílkoviny) jsou životně nezbytné molekuly. Existuje nespočet různých proteinů, ale jejich funkce jsou známy jen pro některé. Predikce funkcí proteinů je jeden z nejdůležitějších cílů současné výpočetní biologie. Funkce a další vlastnosti proteinů jsou dány zejména jejich 3D prostorovou strukturou (na úrovni atomů nebo aminokyselin). Navrhujeme vyvinout algoritmy schopné se naučit prediktivní modely pro proteinové funkce z těchto prostorových dat doplněných daty sekvenčními, fylogenickými, interakčními a daty exprese a informacemi o evolučně konzervovaných motivech. K tomu vytvoříme originální statisticko-relační algoritmy učení využívající prostorovou povahu 3D proteinových dat prostorově orientovanými prohledávacími heuristikami (jako dynamické změny prost. rozlišení), prostorovým uvažováním, souřadnicově závislým ohodnocením logických formulí (prediktivních vzorů), a vzorkovací přibližnou integrací tohoto ohodnocení v R^3 podprostorech proteinových konformací k detekci aktivních míst. Předběžné experimenty naznačují životaschopnost navrhovaných technik.

Klíčová slova

Machine learning Bioinformatics

Veřejná podpora

  • Poskytovatel

    Grantová agentura České republiky

  • Program

    Standardní projekty

  • Veřejná soutěž

    Standardní projekty 15 (SGA02012GA-ST)

  • Hlavní účastníci

    České vysoké učení technické v Praze / Fakulta elektrotechnická

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    P202-12-2032

Alternativní jazyk

  • Název projektu anglicky

    Predicting protein properties through spatial statistical relational machine learning

  • Anotace anglicky

    Proteins are molecules vital for life. There is a vast number of different proteins but their functions are known only for some of them. Prediction of protein function is one of the most important goals of current computational biology. Function and other protein properties follow mainly from their 3D spatial structure (on atom or amino acid level). We propose to create algorithms able to learn predictive models for protein functions from such spatial data complemented with sequential, phylogeny, interaction and expression data as well as evolutionarily conserved motif information. To this end we will develop novel statistical-relational learning algorithms leveraging the spatial nature of 3D protein data by spatially-inspired search heuristics (such as dynamic resolution switching), spatial reasoning, location-dependent evaluation of logical formulas (patterns), and sampling-based approximative integration of the latter over subspaces in the R^3 protein conformation space enabling active-site detection. Preliminary experiments indicate the viability of the proposed directions.

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • CEP - hlavní obor

    JD - Využití počítačů, robotika a její aplikace

  • CEP - vedlejší obor

    EB - Genetika a molekulární biologie

  • CEP - další vedlejší obor

  • OECD FORD - odpovídající obory
    (dle převodníku)

    10603 - Genetics and heredity (medical genetics to be 3)
    10604 - Reproductive biology (medical aspects to be 3)
    10605 - Developmental biology
    10608 - Biochemistry and molecular biology
    10609 - Biochemical research methods
    20204 - Robotics and automatic control
    20205 - Automation and control systems
    30101 - Human genetics

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Zhodnocení výsledků projektu

    Cíle projektu byly splněny. Byly vytvořeny nové algoritmy a teoretické principy pro efektivní relační strojové učení z velkých popisů proteinů a byly využity pro predikci různých vlastností proteinů. Výsledky byly publikovány ve čtyřech článcích ve významných časopisech a na významné konferenci. Nebyly zjištěny nedostatky v dodržování grantových pravidel ani v čerpání finančních prostředků.

Termíny řešení

  • Zahájení řešení

    1. 1. 2012

  • Ukončení řešení

    24. 11. 2016

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    1. 4. 2016

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP17-GA0-GA-U/03:1

  • Datum dodání záznamu

    28. 6. 2017

Finance

  • Celkové uznané náklady

    3 946 tis. Kč

  • Výše podpory ze státního rozpočtu

    3 946 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč

Základní informace

Uznané náklady

3 946 tis. Kč

Statní podpora

3 946 tis. Kč

100%


Poskytovatel

Grantová agentura České republiky

CEP

JD - Využití počítačů, robotika a její aplikace

Doba řešení

01. 01. 2012 - 24. 11. 2016