Predicting protein properties through spatial statistical relational machine learning
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 15 (SGA02012GA-ST)
Main participants
České vysoké učení technické v Praze / Fakulta elektrotechnická
Contest type
VS - Public tender
Contract ID
P202-12-2032
Alternative language
Project name in Czech
Predikce vlastností bílkovin prostorovým statistickým relačním strojovým učením
Annotation in Czech
Proteiny (bílkoviny) jsou životně nezbytné molekuly. Existuje nespočet různých proteinů, ale jejich funkce jsou známy jen pro některé. Predikce funkcí proteinů je jeden z nejdůležitějších cílů současné výpočetní biologie. Funkce a další vlastnosti proteinů jsou dány zejména jejich 3D prostorovou strukturou (na úrovni atomů nebo aminokyselin). Navrhujeme vyvinout algoritmy schopné se naučit prediktivní modely pro proteinové funkce z těchto prostorových dat doplněných daty sekvenčními, fylogenickými, interakčními a daty exprese a informacemi o evolučně konzervovaných motivech. K tomu vytvoříme originální statisticko-relační algoritmy učení využívající prostorovou povahu 3D proteinových dat prostorově orientovanými prohledávacími heuristikami (jako dynamické změny prost. rozlišení), prostorovým uvažováním, souřadnicově závislým ohodnocením logických formulí (prediktivních vzorů), a vzorkovací přibližnou integrací tohoto ohodnocení v R^3 podprostorech proteinových konformací k detekci aktivních míst. Předběžné experimenty naznačují životaschopnost navrhovaných technik.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
JD - Use of computers, robotics and its application
CEP - secondary branch
EB - Genetics and molecular biology
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10603 - Genetics and heredity (medical genetics to be 3)<br>10604 - Reproductive biology (medical aspects to be 3)<br>10605 - Developmental biology<br>10608 - Biochemistry and molecular biology<br>10609 - Biochemical research methods<br>20204 - Robotics and automatic control<br>20205 - Automation and control systems<br>30101 - Human genetics
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
Project objectives were met; the project has generated new algorithms and theoretical principles for effective relational machine learning from large representations of proteins. Results were used to predict a number of different protein properties. The results were published in four articles in major journals and major conference. There were no problems concerning grant rules or the use of funds.
Solution timeline
Realization period - beginning
Jan 1, 2012
Realization period - end
Nov 24, 2016
Project status
U - Finished project
Latest support payment
Apr 1, 2016
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP17-GA0-GA-U/03:1
Data delivery date
Jun 28, 2017
Finance
Total approved costs
3,946 thou. CZK
Public financial support
3,946 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK