High throughput bacterial genome assembly and annotation techniques using genomic signal processing
Project goals
The project is focused on computational whole-genome analysis of bacteria using digital signal processing methods (DSP). As first, a new algorithm for genome assembly will be developed with detection of copy number variation segments (CNV) from sequencing data in signal representation. The algorithm will better preserve repetitive information in the genome which is necessary for detection and classification of mobile genetic elements (MGE) that carry genes of antibiotic resistance. A vector of characteristic features will be constructed on the basis of known MGE and with the help of DSP methods like spectral analysis or wavelet transform. The vector is needed for compilation of classification model using machine learning techniques which will be used to identify undescribed MGE to provide more precise description of origin and spreading of bacterial resistance. The development of new computational methods will be tested and laboratory validated on real genomes of bacteria Klebsiella pneumoniae and Clostridium difficile in labs of University Hospital Brno.
Keywords
digital signal processinggenomic signalwhole-genome analysisantibiotic resistancede-novo genome assemblysequencingmobile genetic elementsmachine learning techniqueswavelet transform
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 21 (SGA0201700001)
Main participants
Vysoké učení technické v Brně / Fakulta elektrotechniky a komunikačních technologií
Contest type
VS - Public tender
Contract ID
17-01821S
Alternative language
Project name in Czech
Výkonnostní techniky pro sestavování a anotaci bakteriálního genomu využívající číslicové zpracování genomických signálů
Annotation in Czech
Projekt se zabývá výpočetní celogenomovou analýzou bakteriálních genomů pomocí metod číslicového zpracování signálů (DSP). První částí projektu je vývoj nového algoritmu pro skládání genomu s detekcí segmentů s variabilním počtem kopií (CNV) ze sekvenačních dat v signálové podobě. Tento algoritmus umožní lépe zachovat repetitivní informaci obsaženou v sekvenci nezbytnou pro další část projektu. Ta je zaměřena na detekci a klasifikaci mobilních genetických elementů (MGE) nesoucích geny antibiotické rezistence. Na základě známých MGE s pomocí metod DSP jako spektrální analýza, vlnková transformace nebo nukleotidové denzitní motivy bude sestavován vektor charakteristických příznaků potřebný pro sestavení klasifikačního modelu metodami strojového učení. Klasifikační modely budou použity pro identifikaci nepopsaných MGE, což povede k přesnějšímu popisu vzniku a šíření bakteriální rezistence. Vývoj výpočetních metod bude testován a laboratorně ověřen na reálných záznamech genomů bakterií Klebsiella pneumoniae a Clostridium difficile laboratoří molekulární biologie FN Brno.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
IN - Informatics
CEP - secondary branch
EB - Genetics and molecular biology
CEP - another secondary branch
—
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
10603 - Genetics and heredity (medical genetics to be 3)
10604 - Reproductive biology (medical aspects to be 3)
10605 - Developmental biology
10608 - Biochemistry and molecular biology
10609 - Biochemical research methods
30101 - Human genetics
Solution timeline
Realization period - beginning
Jan 1, 2017
Realization period - end
Dec 31, 2021
Project status
—
Latest support payment
Jun 6, 2019
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP21-GA0-GA-R/13:1
Data delivery date
Feb 22, 2021
Finance
Total approved costs
5,555 thou. CZK
Public financial support
5,483 thou. CZK
Other public sources
72 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
5 555 CZK thou.
Public support
5 483 CZK thou.
98%
Provider
Czech Science Foundation
CEP
IN - Informatics
Solution period
01. 01. 2017 - 31. 12. 2021