Real-time determination of infection threats from raw nanopore signals using machine learning techniques
Project goals
Nanopore sequencers represent the future of DNA sequencing. The main advantages are low acquisition cost, connectivity, easy samples extraction and sequencing library preparation. These attributes make nanopore sequencing available even for small projects or sequencing in the field. Moreover, it allows much wider use of sequencing data as it is possible to obtain not only pure genetic information but also valuable epigenetic data allowing phenotype prediction directly from sequencing of native DNA even without prior chemical modification. Thus, with a single instrument, we can identify and quantify microbial strains, profile antimicrobial resistance, or detect structural variation based on a single sequencing run. However, all mentioned analyses require high-performance tools for sequencing data postprocessing. Moreover, we lose the most significant nanopore sequencing advantage – real-time access to the sequencing run. Our proposed approach utilizes real-time run access to process raw nanopore data, allowing immediate profiling and infectious risk assessment.
Keywords
genomic signal processingartificial intelligencewhole-genome analysisgenotypingclassification techniquesgenome assemblysequencing data yieldgenetic markers identification
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
SGA0202300001
Main participants
Vysoké učení technické v Brně / Fakulta elektrotechniky a komunikačních technologií
Contest type
VS - Public tender
Contract ID
23-05845S
Alternative language
Project name in Czech
Určování infekčních hrozeb v reálném čase ze surových nanoporových signálů pomocí technik strojového učení
Annotation in Czech
Nanopórové sekvenování se díky nízkým pořizovacím nákladům, konektivitě, miniaturním sekvenátorům, jednoduché extrakci vzorků a přípravě sekvenační knihovny, stává budoucností sekvenace DNA. Je dostupné i pro malé laboratoře nebo terénní pracoviště na celém světě. Navíc umožňuje mnohem širší využití sekvenačních dat, kde z přímého sekvenování nativní DNA i bez předchozí chemické modifikace jsme schopni zjistit nejen čistě genetickou informaci, ale i cenná epigenetická data umožňující predikci fenotypu. Tím můžeme díky jednomu přístroji, na základě jednoho sekvenačního běhu identifikovat a kvantifikovat mikrobiální kmeny, profilovat antimikrobiální rezistenci nebo detekovat strukturální variace. K tomu všemu jsou zapotřebí velmi pokročilé nástroje pro postsekvenační zpracování genetické informace. Těmi ovšem ztrácíme největší výhodu nanopórového sekvenování – přístup k sekvenačním datům již v průběhu sekvenace. Námi navrhovaný způsob zachovává přístup v reálném čase, díky zpracování surového nanopórového signálu, a tím umožňuje okamžité profilování a posouzení infekčních rizik.
Scientific branches
R&D category
ZV - Basic research
OECD FORD - main branch
10606 - Microbiology
OECD FORD - secondary branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - another secondary branch
10608 - Biochemistry and molecular biology
AF - Documentation, librarianship, work with information
BC - Theory and management systems
BD - Information theory
CE - Biochemistry
EB - Genetics and molecular biology
EE - Microbiology, virology
IN - Informatics
Solution timeline
Realization period - beginning
Jan 1, 2023
Realization period - end
Dec 31, 2025
Project status
K - Ending multi-year project
Latest support payment
May 21, 2024
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP25-GA0-GA-R
Data delivery date
Mar 14, 2025
Finance
Total approved costs
9,491 thou. CZK
Public financial support
9,491 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
9 491 CZK thou.
Public support
9 491 CZK thou.
100%
Provider
Czech Science Foundation
OECD FORD
Microbiology
Solution period
01. 01. 2023 - 31. 12. 2025