Correlations and variations of nucleotide and short oligonucleotide distributions in the genome of Caenorhabditis elegans
Project goals
In this project we suggest to create software for variation and correlation analysis of nucleotide and short oligonucleotide distributions in genomes. This software will be applied to the genome of Caenorhabditis elegans. The variation analysis will distinguish the less informative oligonucleotides, whose distributions are not much different from distributions in random sequences, from those oligonucleotides whose distributions are non-uniform. This information will enable identification of genomic regions with important functions. Correlation analysis will ease the understanding of the causes and consequences of A x C and G x T distribution anticorrelations, which were discovered in our laboratory, and of strong C and G clustering. We will also carryout con-elation analysis of dinucleotide distributions in order to identify the causes of universal TA dinucleotide deficiency in the genomes and strong dependence of the CG dinucleotide correlations and variations on the parent organism. Mutual co
Keywords
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 1 (SGA02002GA-ST)
Main participants
Biofyzikální ústav AV ČR, v. v. i.
Contest type
VS - Public tender
Contract ID
—
Alternative language
Project name in Czech
korelace a variace rozložení nukleotidů a krátkých oligonukleotidů v genomu Caenorhabditis elegans
Annotation in Czech
V tomto projektu navrhujeme vytvořit software pro analýzu variací a korelací rozložení nukleotidů a oligonukleotidů v genomech. Tento software chceme aplikovat na genom Caenorhabditis elegans. Analýzy variací odliší málo informativní oligonukleotidy, jejichž rozložení se příliš neliší od rozložení v náhodných posloupnostech od těch, které jsou rozloženy nerovnoměrně. Tyto informace umožní identifikovat funkčně významné oblasti v genomech. Analýza kolerací pomůže lépe pochopit příčiny a důsledky v našlaboratoři objevené antikorelace v rozložení A a C a G a T v genomech a dále silné shlukování C s G. Také provedeme analýzu korelací rozložení dinukleotidů s cílem zjistit příčiny univerzální definice nukleotidu TA v genomech a silné závislosti variací akorelací dinukleotidu CG v genomech na tom, ze kterého organizmu pochází. Vzájemné porovnání korelací a variací v molekulách DNA šesti chromozómů tvořících genom C. elegans přispěje k pochopení jejich funkčních a evolučních souvislostí.
Scientific branches
R&D category
—
CEP classification - main branch
EB - Genetics and molecular biology
CEP - secondary branch
EI - Biotechnology and bionics
CEP - another secondary branch
JC - Computer hardware and software
10603 - Genetics and heredity (medical genetics to be 3)
10604 - Reproductive biology (medical aspects to be 3)
10605 - Developmental biology
10608 - Biochemistry and molecular biology
10609 - Biochemical research methods
20206 - Computer hardware and architecture
20801 - Environmental biotechnology
20802 - Bioremediation, diagnostic biotechnologies (DNA chips and biosensing devices) in environmental management
20803 - Environmental biotechnology related ethics
20901 - Industrial biotechnology
20902 - Bioprocessing technologies (industrial processes relying on biological agents to drive the process) biocatalysis, fermentation
20903 - Bioproducts (products that are manufactured using biological material as feedstock) biomaterials, bioplastics, biofuels, bioderived bulk and fine chemicals, bio-derived novel materials
30101 - Human genetics
30401 - Health-related biotechnology
30402 - Technologies involving the manipulation of cells, tissues, organs or the whole organism (assisted reproduction)
30403 - Technologies involving identifying the functioning of DNA, proteins and enzymes and how they influence the onset of disease and maintenance of well-being (gene-based diagnostics and therapeutic interventions [pharmacogenomics, gene-based therapeutics])
30404 - Biomaterials (as related to medical implants, devices, sensors)
30405 - Medical biotechnology related ethics
40401 - Agricultural biotechnology and food biotechnology
40402 - GM technology (crops and livestock), livestock cloning, marker assisted selection, diagnostics (DNA chips and biosensing devices for the early/accurate detection of diseases) biomass feedstock production technologies, biopharming
40403 - Agricultural biotechnology related ethics
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
Projekt b yl předčasně ukončen na žádost řešitele (dlouhodobý zahraniční pobyt). Závěrečná karta projektu je v souladu se závěrečnou zprávou. Získané výsledky jsou adekvátní době řešení projektu (1 rok a 4 měsíce). Výstupem projektu je přiložený rukopis
Solution timeline
Realization period - beginning
Jan 1, 2000
Realization period - end
Jan 1, 2003
Project status
S - Stopped (prematurely terminated) multi-year project
Latest support payment
—
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP/2002/GA0/GA02GA/U/N/7:3
Data delivery date
Apr 1, 2003
Finance
Total approved costs
567 thou. CZK
Public financial support
283 thou. CZK
Other public sources
394 thou. CZK
Non public and foreign sources
0 thou. CZK
Recognised costs
567 CZK thou.
Public support
283 CZK thou.
0%
Provider
Czech Science Foundation
CEP
EB - Genetics and molecular biology
Solution period
01. 01. 2000 - 01. 01. 2003