Targeting protein cryptic binding sites with machine learning
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
SGA0202300001
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VS - Public tender
Contract ID
23-07349S
Alternative language
Project name in Czech
Detekce kryptických aktivních míst proteinů pomocí strojového učení
Annotation in Czech
Znalost vazebných míst (VM) je jedna z prerekvizit racionálního vývoje léčiv. Bohužel, tradiční přístupy k detekci VM nejsou schopny identifkovat kryptická vazebná místa (KVM), tj. místa která po napojení ligandu mění svoji strukturu. Ačkoli existuje několik metod pro detekci KVM, všechny vyžadují znalost proteinové struktury, a tedy nejsou schopny detekovat velké množství VM, které jsou detekovatelné v dostupných proteinových sekvencích. Proto navrhujeme sekvenční přístup k detekci KVM založený na hlubokém učení využívající strukturní data pouze ve fázi učení. Navržené řešení bude postaveno na architektuře grafové neuronové sítě, která bude na vstupu přijímat graf odvozený z proteinové sekvence kódující významné vztahy mezi residui. Za účelem natrénování modelu vytvoříme databázi (DB) experimentálních a predikovaných strukturních stavů proteinů. DB bude zdrojem prvního benchmarku svého druhu pro detekci KVM, který bude významným příspěvkem jak v oblasti bioinformatiky, tak strojového učení. Řešení bude integrováno do stávajícího frameworku pro detekci VM ze struktury.
Scientific branches
R&D category
ZV - Basic research
OECD FORD - main branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - secondary branch
—
OECD FORD - another secondary branch
—
CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
AF - Documentation, librarianship, work with information<br>BC - Theory and management systems<br>BD - Information theory<br>IN - Informatics
Solution timeline
Realization period - beginning
Mar 1, 2023
Realization period - end
Dec 31, 2025
Project status
B - Running multi-year project
Latest support payment
May 4, 2023
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP24-GA0-GA-R
Data delivery date
Feb 19, 2024
Finance
Total approved costs
7,346 thou. CZK
Public financial support
6,860 thou. CZK
Other public sources
486 thou. CZK
Non public and foreign sources
0 thou. CZK