Klasifikátor vazebných kapes v proteinech založený na strojovém učení
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14310%2F24%3A00138661" target="_blank" >RIV/00216224:14310/24:00138661 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Klasifikátor vazebných kapes v proteinech založený na strojovém učení
Popis výsledku v původním jazyce
Některé strukturní prvky proteinů hrají rozhodující roli při navázání a uvolnění ligandů, např. povrchové vazebné rozhraní, tunel s jedním otvorem, který spojuje aktivní místo s vnějším prostředím, nebo oboustranně otevřený kanál. Pro výpočet tunelů a kanálů existuje několik metod, které však vyžadují vlastní nastavení, aby poskytly kvalitní výsledky. Zejména rozlišení mezi povrchovými a zanořenými vazebnými kapsami je pro výpočet tunelu kritické, ale zatím není dořešené. Cílem tohoto klasifikátoru je vyřešit tento problém pomocí funkcí FPOCKET a ručně označeného souboru dat 200 kapes klasifikovaných jako povrchové, hraniční a zanořené. Klasifikátor se skládá z malé umělé neuronové sítě a dosahuje přesnosti 54 % a skóre F1 50 %.
Název v anglickém jazyce
A machine learning-based classifier of binding pockets in proteins
Popis výsledku anglicky
Certain structural elements of proteins play a critical role in binding and unbinding ligands, e.g., the surface binding interface, a tunnel with one opening that connects the active site with the outside environment, or a channel open on both sides. There are several methods for tunnel and channel calculation, but they require customized settings to produce high-quality results. In particular, the discrimination between surface and buried binding pockets is critical for tunnel calculation but is an open problem. This classifier aims to solve this problem using FPOCKET features and manually labelled dataset of 200 pockets classified as surface, borderline, and buried. The classifier consists of a small artificial neural network and achieves the accuracy of 54% and F1 score of 50%.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2023049" target="_blank" >LM2023049: Český národní uzel Evropské sítě infrastruktur klinického výzkumu</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
3_SW_MU_2024
Technické parametry
Doposud je využíváno interně k výzkumným účelům.
Ekonomické parametry
V budoucnu je plánována komerční nabídka potencionálním partnerům z komerční sféry.
IČO vlastníka výsledku
00216224
Název vlastníka
Masarykova univerzita