Logické strojové učení pro analýzu genomických dat
Cíle projektu
V současné vlně zájmu o objevování souvislostí z dat genové exprese prostředky strojového učení (SU) a data miningu nemají algoritmy relačního strojového učení založeného na logice (RSUZL) téměř žádnou pozornost, což kontrastuje s jejich dobrými výsledkyv jiných biologických aplikacích, jejich silným teoretickým základům, dostupností implementací jejich rozmanitých algoritmů a zejm. srozumitelností jejich výstupů a možností je přímo biologicky interpretovat. Důvodem jejich nevyužití je, že oproti statistickým přístupům v této aplikační oblasti zatím preferovaným vykazují výše zmíněné algoritmy malou robustnost vůči chybám v datech, nízkou efektivitu v mnohaatributových genetických doménách a disponují nedostatečnými prostředky pro modelování neurčitosti. Tyto algoritmické nedostatky odstraníme implementací pravděpodobnostní inference a reprezentace do algoritmů RSUZL a experimentálně předvedeme jeho sílu v oblasti objevování souvislostí mezi geny.
Klíčová slova
machine learningknowledge discovery in databasesinductive logic programminggene expression data
Veřejná podpora
Poskytovatel
Akademie věd České republiky
Program
Juniorské badatelské grantové projekty
Veřejná soutěž
Juniorské badatelské grantové projekty 3 (SAV02005-J)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
—
Alternativní jazyk
Název projektu anglicky
Logic-based machine learning for genomic data analysis
Anotace anglicky
In the current raise of interest in the research on gene relationship discovery from gene expression data by means of machine learning and data mining, logic-based relational machine learning (LBRML) algorithms receive little or no attention, which contrasts with their successes in related biological applications, their strong theoretical foundations, the availability of a plethora of implementations, and mainly the understandability and direct biological interpretability of their outputs. Their littlepenetration is due to the fact that in comparison to statistical approaches currently favored in this application field, LBRML exhibits insufficient robustness agains data imperfection, inefficiency in the attribute-rich genetic domains and insufficientuncertainty modeling features. We will eliminate these algorithmic defficiencies by incorporating probabilistic inference/representation techniques into LBRML and demonstrate experimentally its power in the gene relationship discovery.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
IN - Informatika
CEP - vedlejší obor
—
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory
(dle převodníku)10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Byly zdokonaleny existující algoritmy relačního strojového učení založené na logice a vyvinuty nové algoritmy použitelné pro účel nalézání neznámých biologických zákonitostí z genomických dat, zejména z dat genové exprese měřených DNA čipy.
Termíny řešení
Zahájení řešení
1. 1. 2005
Ukončení řešení
1. 1. 2006
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP07-AV0-KJ-U/02:2
Datum dodání záznamu
3. 4. 2009
Finance
Celkové uznané náklady
286 tis. Kč
Výše podpory ze státního rozpočtu
286 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
286 tis. Kč
Statní podpora
286 tis. Kč
100%
Poskytovatel
Akademie věd České republiky
CEP
IN - Informatika
Doba řešení
01. 01. 2005 - 01. 01. 2006