Biophysics and bioinformatics of the regions in the human genome with extreme nucleotide distributions
Project goals
Our preliminary results show that the human genome contains surprisingly large amounts of very long regions (even more than 1000 nucleotides) exclusively containing A and T. The situation is similar with A and G, A and C and C and G. Regions where theircontent is higher than 90% are still much longer. Studies on model polynucleotides demonstrate that such molecules exhibit dramatically different biophysical properties than the common DNA containing all four nucleotides. In this project, we propose toidentify the extremely biased regions by bioinformatic methods in the human, chimp, mouse and other genomes and their representative examples analyze by biophysical and biochemical approaches such as CD spectroscopy, electrophoresis, photochemical methods, enzymic and chemical probes and computer modeling. We will correlate results of the biophysical and biochemical analyses with the functional map of the human and other genomes with the aim to understand the role the longest A+T, A+G, A+C and G+C
Keywords
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 10 (SGA02007GA-ST)
Main participants
—
Contest type
VS - Public tender
Contract ID
202/07/0094
Alternative language
Project name in Czech
Biofyzika a bioinformatika oblastí lidského genomu s extrémním rozložením nukleotidů
Annotation in Czech
Naše předběžné výsledky ukazují, že v lidském genomu se v překvapivě vysokém množství nacházejí velmi dlouhé oblasti (i více než 1000 nukleotidů) tvořené výlučně nukleotidy A a T. Podobná je i situace ohledně nukleotidů A a G, A a C a G a C. Oblasti, kdeje jejich zastoupení vyšší než 90% jsou ještě mnohem delší. Přitom studie na modelových polynukleotidech ukazují, že takové oblasti vykazují dramaticky odlišné biofyzikální vlastnosti než běžná DNA, kde se všechny čtyři nukleotidy střídají. V tomto projektu navrhujeme bioinformatickými metodami identifikovat a analyzovat tyto oblasti v lidském, šimpanzím, myším a dalších genomech a vybrané z nich zkoumat biofyzikálními a biochemickými přístupy jako je CD spektroskopie, elektroforéza, fotochemické metody, enzymové a chemické próby a počítačové modelování. Výsledky bioinformatických a biofyzikálních analýz budeme korelovat s funkční mapou lidského a dalších genomů s cílem pochopit, k čemu velmi dlouhé oblasti A+T, A+G, A+C a G+C v genomech slouží.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
BO - Biophysics
CEP - secondary branch
EB - Genetics and molecular biology
CEP - another secondary branch
CE - Biochemistry
10603 - Genetics and heredity (medical genetics to be 3)
10604 - Reproductive biology (medical aspects to be 3)
10605 - Developmental biology
10608 - Biochemistry and molecular biology
10609 - Biochemical research methods
10610 - Biophysics
30101 - Human genetics
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
.
Solution timeline
Realization period - beginning
Jan 1, 2007
Realization period - end
Dec 31, 2009
Project status
U - Finished project
Latest support payment
Apr 22, 2009
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP10-GA0-GA-U/02:2
Data delivery date
Jan 22, 2015
Finance
Total approved costs
2,815 thou. CZK
Public financial support
2,815 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Recognised costs
2 815 CZK thou.
Public support
2 815 CZK thou.
0%
Provider
Czech Science Foundation
CEP
BO - Biophysics
Solution period
01. 01. 2007 - 31. 12. 2009