Efektivní vyhledávání řetězců pro Bioinformatiku
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 23 (SGA0201900001)
Hlavní účastníci
České vysoké učení technické v Praze / Fakulta informačních technologií
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
19-20759S
Alternativní jazyk
Název projektu anglicky
Efficient String Matching for Bioinformatics
Anotace anglicky
Index is a way to rapidly increase the speed of searching in data given in advance. The constructed index then allows search time proportional to the pattern size and the number of its occurrences. The aim of the project is to develop new algorithms and data structures for areas managing large data collections (DNA/RNA sequences) supporting not only exact pattern matching but also more complex tasks like degenerate or elastic pattern matching. There are many advanced techniques for indexing strings combining both data compression and stringology. However, there are still challenging new tasks for special cases like indexing highly similar texts where general purpose indexing methods are not efficient. This is for instance the case of genomes of the same species. Some on-line methods for recently introduced elastic pattern matching will also be developed.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
O - Nesplněno zadání, smlouva však byla dodržena
Zhodnocení výsledků projektu
Cílem projektu bylo vyvinout nové ppřístupy ke zpracování velkého množství dat, umožňující vyhledávání degenerativního či elastického vzorku v DNA/RNA sekvencích. Předpokládané výstupy projektu se však nepodařilo naplnit. Byla dosažena pouze jedna konferenční publikace a v mnoha plánovaných oblastech nebyl výzkum ani zahájen. Proto byl projekt ze strany poskytovatele předčasně ukončen.
Termíny řešení
Zahájení řešení
1. 1. 2019
Ukončení řešení
31. 12. 2020
Poslední stav řešení
S - Zastavený (předčasně ukončený) víceletý projekt
Poslední uvolnění podpory
1. 4. 2020
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP22-GA0-GA-U
Datum dodání záznamu
19. 7. 2022
Finance
Celkové uznané náklady
3 562 tis. Kč
Výše podpory ze státního rozpočtu
3 076 tis. Kč
Ostatní veřejné zdroje financování
324 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč