Detekce kryptických aktivních míst proteinů pomocí strojového učení
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
SGA0202300001
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
23-07349S
Alternativní jazyk
Název projektu anglicky
Targeting protein cryptic binding sites with machine learning
Anotace anglicky
Knowledge of binding sites (BSs) is one of the prerequisites of rational drug design. However, traditional BS detection approaches fail to identify cryptic BSs (CBSs), i.e., sites that change conformation upon ligand binding. Although several methods for CBS detection exist, they are all restricted to protein structure, missing a great number of BSs detectable in the available protein sequences. Therefore, we propose a sequence-based deep learning solution for CBS detection which uses structural data only in the training phase. The solution will be based on a graph neural network architecture, taking as its input a protein sequence graph representation that will encode important residue relationships. To train the model, we will develop a knowledge base (KB) of experimental and predicted protein structure states. The KB will serve as the source for the first-of-its-kind benchmark dataset for CBS detection, a substantial contribution to both bioinformatics and machine learning research. The solution will be integrated into an existing framework for structure-based BS detection.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika
Termíny řešení
Zahájení řešení
1. 3. 2023
Ukončení řešení
31. 12. 2025
Poslední stav řešení
B - Běžící víceletý projekt
Poslední uvolnění podpory
4. 5. 2023
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP24-GA0-GA-R
Datum dodání záznamu
19. 2. 2024
Finance
Celkové uznané náklady
7 346 tis. Kč
Výše podpory ze státního rozpočtu
6 860 tis. Kč
Ostatní veřejné zdroje financování
486 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč