Predikce vlastností bílkovin prostorovým statistickým relačním strojovým učením
Cíle projektu
Proteiny (bílkoviny) jsou životně nezbytné molekuly. Existuje nespočet různých proteinů, ale jejich funkce jsou známy jen pro některé. Predikce funkcí proteinů je jeden z nejdůležitějších cílů současné výpočetní biologie. Funkce a další vlastnosti proteinů jsou dány zejména jejich 3D prostorovou strukturou (na úrovni atomů nebo aminokyselin). Navrhujeme vyvinout algoritmy schopné se naučit prediktivní modely pro proteinové funkce z těchto prostorových dat doplněných daty sekvenčními, fylogenickými, interakčními a daty exprese a informacemi o evolučně konzervovaných motivech. K tomu vytvoříme originální statisticko-relační algoritmy učení využívající prostorovou povahu 3D proteinových dat prostorově orientovanými prohledávacími heuristikami (jako dynamické změny prost. rozlišení), prostorovým uvažováním, souřadnicově závislým ohodnocením logických formulí (prediktivních vzorů), a vzorkovací přibližnou integrací tohoto ohodnocení v R^3 podprostorech proteinových konformací k detekci aktivních míst. Předběžné experimenty naznačují životaschopnost navrhovaných technik.
Klíčová slova
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 15 (SGA02012GA-ST)
Hlavní účastníci
České vysoké učení technické v Praze / Fakulta elektrotechnická
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
P202-12-2032
Alternativní jazyk
Název projektu anglicky
Predicting protein properties through spatial statistical relational machine learning
Anotace anglicky
Proteins are molecules vital for life. There is a vast number of different proteins but their functions are known only for some of them. Prediction of protein function is one of the most important goals of current computational biology. Function and other protein properties follow mainly from their 3D spatial structure (on atom or amino acid level). We propose to create algorithms able to learn predictive models for protein functions from such spatial data complemented with sequential, phylogeny, interaction and expression data as well as evolutionarily conserved motif information. To this end we will develop novel statistical-relational learning algorithms leveraging the spatial nature of 3D protein data by spatially-inspired search heuristics (such as dynamic resolution switching), spatial reasoning, location-dependent evaluation of logical formulas (patterns), and sampling-based approximative integration of the latter over subspaces in the R^3 protein conformation space enabling active-site detection. Preliminary experiments indicate the viability of the proposed directions.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
JD - Využití počítačů, robotika a její aplikace
CEP - vedlejší obor
EB - Genetika a molekulární biologie
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory
(dle převodníku)10603 - Genetics and heredity (medical genetics to be 3)
10604 - Reproductive biology (medical aspects to be 3)
10605 - Developmental biology
10608 - Biochemistry and molecular biology
10609 - Biochemical research methods
20204 - Robotics and automatic control
20205 - Automation and control systems
30101 - Human genetics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Cíle projektu byly splněny. Byly vytvořeny nové algoritmy a teoretické principy pro efektivní relační strojové učení z velkých popisů proteinů a byly využity pro predikci různých vlastností proteinů. Výsledky byly publikovány ve čtyřech článcích ve významných časopisech a na významné konferenci. Nebyly zjištěny nedostatky v dodržování grantových pravidel ani v čerpání finančních prostředků.
Termíny řešení
Zahájení řešení
1. 1. 2012
Ukončení řešení
24. 11. 2016
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
1. 4. 2016
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP17-GA0-GA-U/03:1
Datum dodání záznamu
28. 6. 2017
Finance
Celkové uznané náklady
3 946 tis. Kč
Výše podpory ze státního rozpočtu
3 946 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
3 946 tis. Kč
Statní podpora
3 946 tis. Kč
100%
Poskytovatel
Grantová agentura České republiky
CEP
JD - Využití počítačů, robotika a její aplikace
Doba řešení
01. 01. 2012 - 24. 11. 2016