SoluProt: prediction of soluble protein expression in Escherichia coli
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14310%2F21%3A00119188" target="_blank" >RIV/00216224:14310/21:00119188 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/00159816:_____/21:00075155 RIV/00216305:26230/21:PU138927
Výsledek na webu
<a href="https://academic.oup.com/bioinformatics/article/37/1/23/6070085" target="_blank" >https://academic.oup.com/bioinformatics/article/37/1/23/6070085</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1093/bioinformatics/btaa1102" target="_blank" >10.1093/bioinformatics/btaa1102</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
SoluProt: prediction of soluble protein expression in Escherichia coli
Popis výsledku v původním jazyce
Motivation: Poor protein solubility hinders the production of many therapeutic and industrially useful proteins. Experimental efforts to increase solubility are plagued by low success rates and often reduce biological activity. Computational prediction of protein expressibility and solubility in Escherichia coli using only sequence information could reduce the cost of experimental studies by enabling prioritization of highly soluble proteins. Results: A new tool for sequence-based prediction of soluble protein expression in E.coli, SoluProt, was created using the gradient boosting machine technique with the TargetTrack database as a training set. When evaluated against a balanced independent test set derived from the NESG database, SoluProt's accuracy of 58.5% and AUC of 0.62 exceeded those of a suite of alternative solubility prediction tools. There is also evidence that it could significantly increase the success rate of experimental protein studies.
Název v anglickém jazyce
SoluProt: prediction of soluble protein expression in Escherichia coli
Popis výsledku anglicky
Motivation: Poor protein solubility hinders the production of many therapeutic and industrially useful proteins. Experimental efforts to increase solubility are plagued by low success rates and often reduce biological activity. Computational prediction of protein expressibility and solubility in Escherichia coli using only sequence information could reduce the cost of experimental studies by enabling prioritization of highly soluble proteins. Results: A new tool for sequence-based prediction of soluble protein expression in E.coli, SoluProt, was created using the gradient boosting machine technique with the TargetTrack database as a training set. When evaluated against a balanced independent test set derived from the NESG database, SoluProt's accuracy of 58.5% and AUC of 0.62 exceeded those of a suite of alternative solubility prediction tools. There is also evidence that it could significantly increase the success rate of experimental protein studies.
Klasifikace
Druh
J<sub>imp</sub> - Článek v periodiku v databázi Web of Science
CEP obor
—
OECD FORD obor
10602 - Biology (theoretical, mathematical, thermal, cryobiology, biological rhythm), Evolutionary biology
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Bioinformatics
ISSN
1367-4803
e-ISSN
1460-2059
Svazek periodika
37
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
GB - Spojené království Velké Británie a Severního Irska
Počet stran výsledku
6
Strana od-do
23-28
Kód UT WoS článku
000649437800004
EID výsledku v databázi Scopus
—