Komplexita : software pro lingvistické analýzy genetických sekvencí
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11310%2F10%3A10081249" target="_blank" >RIV/00216208:11310/10:10081249 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Komplexita : software pro lingvistické analýzy genetických sekvencí
Popis výsledku v původním jazyce
Bioinformatický program umožňující analýzy genetických sekvencí na základě matematických lingvistických metod, které jsou alternativním bioinformatickým nástrojem pro kvalitativní analýzu genetických sekvencí. Program pracuje se sekvencemi nukleotidů nebo proteinů ve standardních bioinformatických formátech. Umožňuje rozklad textu na potenciální slova délky n. (tzv. Shannonovské n-gramy) a jejich následné statistické zpracování. Program dále nabízí výpočty lingvistických charakteristik jako Shannonova entropie, lingvistická komplexita, lingvistická komplexita dle E.N. Trifonova, markovský model entropie, Wootton - Federhenův index. Mimo tyto základní funkce program umožňuje detekci potenciálně amfipatických peptidů v proteinech, náhodný výběr vzorku zvolené délky, filtraci sekvencí na základě zvolených parametrů a porovnání s náhodným modelem pomocí simulací Monte- Carlo. Program je zveřejněn v anglické verzi, manuál je dostupný v češtině i v angličtině.
Název v anglickém jazyce
Complexity: Software tools for linguistic based analysis of genetic sequences
Popis výsledku anglicky
The program "Complexity" provides analysis of genetic sequences based on mathematic linguistic methods, which are an alternative bioinformatics tools for qualitative analysis of genetic sequences. The program deals with nucleotide and protein sequences in standard bioinformatics formats and provides decomposition of the sequence into potential "words" of length n (so called Shannon's n-grams) and their subsequent statistical analysis. The program provides linguistic measures such as linguistic complexity, linguistic complexity suggested by E.N. Trifonov, Shannon's entropy, Markov's model of entropy and Wootton -Federhen index. There are also other functions, which enable detection of potentially amphipathic peptides in proteins, random selections of given size from investigated text, filtration of the repetitiveness in sequences, comparison with random model using Monte Carlo simulations. Software is available in English version with manual.
Klasifikace
Druh
R - Software
CEP obor
EB - Genetika a molekulární biologie
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2010
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
Com_G.1.1
Technické parametry
http://web.natur.cuni.cz/filosof/index.php/cs/clenove/362-zemkova.html
Ekonomické parametry
Software výrazně usnadňuje a zrychluje výpočty a operace s genetickými sekvencemi, které by byly bez programu prakticky neproveditelné. Tyto lingvistické výpočetní nástroje nejsou v takto kompaktní podobě součástí žádného veřejně dostupného softwaru.
IČO vlastníka výsledku
00216208
Název vlastníka
Přírodovědecká fakulta Univerzity Karlovy v Praze