Predikce vlastností bílkovin prostorovým statistickým relačním strojovým učením
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 15 (SGA02012GA-ST)
Hlavní účastníci
České vysoké učení technické v Praze / Fakulta elektrotechnická
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
P202-12-2032
Alternativní jazyk
Název projektu anglicky
Predicting protein properties through spatial statistical relational machine learning
Anotace anglicky
Proteins are molecules vital for life. There is a vast number of different proteins but their functions are known only for some of them. Prediction of protein function is one of the most important goals of current computational biology. Function and other protein properties follow mainly from their 3D spatial structure (on atom or amino acid level). We propose to create algorithms able to learn predictive models for protein functions from such spatial data complemented with sequential, phylogeny, interaction and expression data as well as evolutionarily conserved motif information. To this end we will develop novel statistical-relational learning algorithms leveraging the spatial nature of 3D protein data by spatially-inspired search heuristics (such as dynamic resolution switching), spatial reasoning, location-dependent evaluation of logical formulas (patterns), and sampling-based approximative integration of the latter over subspaces in the R^3 protein conformation space enabling active-site detection. Preliminary experiments indicate the viability of the proposed directions.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
JD - Využití počítačů, robotika a její aplikace
CEP - vedlejší obor
EB - Genetika a molekulární biologie
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10603 - Genetics and heredity (medical genetics to be 3)<br>10604 - Reproductive biology (medical aspects to be 3)<br>10605 - Developmental biology<br>10608 - Biochemistry and molecular biology<br>10609 - Biochemical research methods<br>20204 - Robotics and automatic control<br>20205 - Automation and control systems<br>30101 - Human genetics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Cíle projektu byly splněny. Byly vytvořeny nové algoritmy a teoretické principy pro efektivní relační strojové učení z velkých popisů proteinů a byly využity pro predikci různých vlastností proteinů. Výsledky byly publikovány ve čtyřech článcích ve významných časopisech a na významné konferenci. Nebyly zjištěny nedostatky v dodržování grantových pravidel ani v čerpání finančních prostředků.
Termíny řešení
Zahájení řešení
1. 1. 2012
Ukončení řešení
24. 11. 2016
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
1. 4. 2016
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP17-GA0-GA-U/03:1
Datum dodání záznamu
28. 6. 2017
Finance
Celkové uznané náklady
3 946 tis. Kč
Výše podpory ze státního rozpočtu
3 946 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč