MolSetinspector
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68378050%3A_____%2F15%3A00502803" target="_blank" >RIV/68378050:_____/15:00502803 - isvavai.cz</a>
Výsledek na webu
<a href="http://openscreen.cz/software/molsetinspector" target="_blank" >http://openscreen.cz/software/molsetinspector</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
MolSetinspector
Popis výsledku v původním jazyce
MolSetInspector (Molecular Sets Inspector) je Python knihovna umožňující zpracování jedné či více množin chemických látek. Na vstupu přijímá adresář obsahující jeden či více souborů (sdf, csv, smi nebo txt), které mohou obsahovat molekuly v různých chemických formátech (smiles, inchi nebo molfile). MolSetInspector automaticky zjistí konkrétní formát, načte všechny molekuly a zpracuje. Během zpracování je možné používat základní možnosti standardizace molekul či odstranění stereochemie. Jako výstup knihovna umožňuje výpis množiny unikátních molekul ze všech načtených společně s informací o jejich přítomnosti v dané množině. Dále je možné vypsat tabulku s průniky jednotlivých množin, duplicitní molekuly, molekuly, které se nepovedlo načíst, nebo použít jednu ze dvou možností selekce diverzní množiny molekul (na základě maximální podobnosti nebo maximálního počtu molekul).
Název v anglickém jazyce
MolSetinspector
Popis výsledku anglicky
MolSetInspector (Molecular Sets Inspector) is a Python package which facilitates the processing of multiple molecular sets stored in various text file formats. As its input, it takes a directory containing the sets of molecules stored in sdf, csv, smi or txt files. The sets are read and joined in one library consisting of distinct molecules. During processing, the molecules are canonicalized, can be standardised (neutralised, unsalted etc.) and tautomers can be removed. As a result, MolSetInspector outputs the intersections of individual molecular sets, the IDs of defective (not parsed) molecules and the list of distinct molecules including a hit table (a hit table shows in which set/s was the molecule found). MolSetInspector can also filter distinct molecules by their diversity using two approaches: by setting 1) a maximum total number of diverse molecules or 2) the maximum similarity treshold of a molecular pair in the set.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/LO1220" target="_blank" >LO1220: CZ-OPENSCREEN: Národní infrastruktura chemické biologie</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
Software-3
Technické parametry
MolSetInspector (Molecular Sets Inspector) je Python knihovna umožňující zpracování jedné či více množin chemických látek. Na vstupu přijímá adresář obsahující jeden či více souborů (sdf, csv, smi nebo txt), které mohou obsahovat molekuly v různých chemických formátech (smiles, inchi nebo molfile). MolSetInspector automaticky zjistí konkrétní formát, načte všechny molekuly a zpracuje. Během zpracování je možné používat základní možnosti standardizace molekul či odstranění stereochemie. Jako výstup knihovna umožňuje výpis množiny unikátních molekul ze všech načtených společně s informací o jejich přítomnosti v dané množině. Dále je možné vypsat tabulku s průniky jednotlivých množin, duplicitní molekuly, molekuly, které se nepovedlo načíst, nebo použít jednu ze dvou možností selekce diverzní množiny molekul (na základě maximální podobnosti nebo maximálního počtu molekul). http://openscreen.cz/software/molsetinspector
Ekonomické parametry
Tato Python knihovna umožňuje zpracování jedné či více množin chemických látek.
IČO vlastníka výsledku
68378050
Název vlastníka
Ústav molekulární genetiky AV ČR, v.v