Using gene ontologies and annotations for gene expression data interpretation through relational machine learning algorithms
Project goals
The objective of the project is to develop algorithms and their software implementations enabling the interpretation of gene expression data by exploiting databases of gene ontologies and annotations, using methods of relational machine learning and relational data mining. In particular, within the proposed 4 project years we aim at developing a platform for the relational integration of gene expression data, gene ontologies and text annotations, mutual gene interactions data, genetic regulatory pathways structure information as well as ontologies of such pathways. On this platform, we aim at devising algorithms for inductive knowledge discovery, emphasising tasks fo predictive classification, association and outlier values detection as well as descriptive tasks such as the discovery of statistically significant relational subgroups or relational hierarhical clustering.
Keywords
gene expressionrelational machine learningrelational data miningregulatory pathwaysgene ontologieinterpretation of gene expression data
Public support
Provider
Ministry of Education, Youth and Sports
Programme
KONTAKT
Call for proposals
KONTAKT 5 (SMSM2007ME2)
Main participants
—
Contest type
VS - Public tender
Contract ID
1322/2010-32
Alternative language
Project name in Czech
Využití genových ontologiií a anotací pro interpretaci dat genové exprese prostřednictvím algoritmů relačního strojového učení
Annotation in Czech
Cílem projektu je vyvinout algoritmy a jejich softwarovou implementaci umožnující interpretaci dat genové exprese za využití databází genových ontologií a anotací, prostřednictvím metod relačního strojového učení a relačního data miningu. Konkrétně, během navrhovaných 4 let projektu chceme vytvořit platformu pro relační integraci dat genové exprese, genových ontologií a textových anotací, dat o vzájemných genových interakcích, dat o struktuře genetických regulačních cyklů (regulatory pathways) a dále ontologií těchto cyklů. Na této platformě chceme vybudovat algoritmy pro induktivní vyhledávání znalostí, s důrazem na prediktivní klasifikaci, detekci asociací a odlehlých hodnot a deskriptivní úlohy, jako je vyhledávání statisticky významných relačních podskupin či relační hierarchické shlukování.
Scientific branches
R&D category
AP - Applied research
CEP classification - main branch
JD - Use of computers, robotics and its application
CEP - secondary branch
JC - Computer hardware and software
CEP - another secondary branch
—
20204 - Robotics and automatic control
20205 - Automation and control systems
20206 - Computer hardware and architecture
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
Methods for set-level classification of gene expression data were tested in extensive experiments and their suitability was confirmed with statistical significance. The public web tool XGENE.ORG for gene expression data analysis was extended by new modules.
Solution timeline
Realization period - beginning
May 1, 2007
Realization period - end
Dec 31, 2010
Project status
U - Finished project
Latest support payment
Feb 16, 2010
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP11-MSM-ME-U/01:1
Data delivery date
Jun 30, 2011
Finance
Total approved costs
596 thou. CZK
Public financial support
368 thou. CZK
Other public sources
228 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
596 CZK thou.
Public support
368 CZK thou.
61%
Provider
Ministry of Education, Youth and Sports
CEP
JD - Use of computers, robotics and its application
Solution period
01. 05. 2007 - 31. 12. 2010