Identifikace nových prognostických subtypů chronické lymfocytární leukemie použitím dráhového mutačního skóre a strojového učení
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14740%2F19%3A00111135" target="_blank" >RIV/00216224:14740/19:00111135 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.onkologickedny.cz/program/identifikace-novych-prognostickych-subtypu-chronicke-lymfocytarni-leukemie-pouzitim-drahoveho-mutacniho-skore-a-strojoveho-uceni/c1533" target="_blank" >https://www.onkologickedny.cz/program/identifikace-novych-prognostickych-subtypu-chronicke-lymfocytarni-leukemie-pouzitim-drahoveho-mutacniho-skore-a-strojoveho-uceni/c1533</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Identifikace nových prognostických subtypů chronické lymfocytární leukemie použitím dráhového mutačního skóre a strojového učení
Popis výsledku v původním jazyce
Chronická lymfocytární leukemie (CLL) je nejběžnější leukemie dospělých s různorodým klinickým průběhem, což do značné míry souvisí s její výraznou genetickou heterogenitou. Doposud bylo u CLL identifikováno pouze několik rekurentně mutovaných genů s klinickým významem; četné mutace v množství dalších genů jsou obvykle považovány za doprovodné a jejich klinický význam zůstává nejasný. Cílem této studie bylo popsat efekt těchto domněle doprovodných mutací pomocí dráhového mutačního skóre a metod strojového učení. Materiál a metody: Z veřejně dostupné databáze jsme získali data od 316 CLL pacientů se somatickými hypermutacemi v těžkém řetězci imunoglobulinů (IGHV). U této skupiny jsme shromáždili 4 739 genů zasažených nesynonymní bodovou mutací a/nebo mutací způsobující posun čtecího rámce. Následně jsme určili biologické dráhy obsahující zasažené geny a na základě rozsahu poškození v dráze jsme vypočítali dráhové mutační skóre pro každého pacienta. Poté jsme využili strojového učení pro identifikaci podskupin pacientů s odlišným časem do léčby (TTT) a vytvořili jsme klasifikační model pro zařazení pacientů do těchto podskupin. Výsledky: Identifikovali jsme pět podskupin lišících se v TTT (p < 0,0001). Čtyři z nich byly charakterizovány odlišnými zasaženými biologickými procesy – buněčná adheze, signalizace regulovaná vápenatými ionty, organizace synapse a transport ABC proteiny. V poslední podskupině nebyly identifikovány charakteristické rekurentně zasažené dráhy. Následně jsme vytvořili klasifikační model, který byl schopen určit nalezené podskupiny na základě dráhového mutačního skóre s přesností 0,77 plochy pod ROC křivkou (AUC). Tento model jsme použili k evaluaci našich výsledků na nezávislém datasetu 187 pacientů se somatickými hypermutacemi v IGHV, ve kterém jsme identifikovali podobnou distribuci podskupin založených na námi navrženém mutačním skóre. Závěr: V souboru CLL pacientů se somatickými hypermutacemi IGHV jsme identifikovali prognostické podskupiny na základě dráhového mutačního skóre. Věříme, že tyto výsledky pomohou zpřesnit diagnostiku pacientů s CLL. V budoucnu se chystáme navržený postup aplikovat na náš vlastní soubor dat z celoexomového sekvenování u CLL pacientů a zkoumat vliv doprovodných mutací na klonální evoluci CLL.
Název v anglickém jazyce
Identification of new prognostic subtypes of chronic lymphocytic leukemia using pathway mutation score and machine learning
Popis výsledku anglicky
Chronic lymphocytic leukemia (CLL) is the most common adult leukemia with a diverse clinical course, largely related to its marked genetic heterogeneity. To date, only a few recurrently mutated genes of clinical relevance have been identified in CLL; Numerous mutations in a number of other genes are usually considered concomitant and their clinical relevance remains unclear. The aim of this study was to describe the effect of these putative accompanying mutations using pathway mutation scores and machine learning methods. Material and methods: We obtained data from 316 CLL patients with somatic hypermutations in immunoglobulin heavy chain (IGHV) from a publicly available database. In this group, we collected 4,739 genes affected by a non-synonymous point mutation and / or a reading frame shift mutation. Subsequently, we determined the biological pathways containing the affected genes and calculated the pathway mutation score for each patient based on the extent of pathway damage. We then used machine learning to identify subgroups of patients with different time to treatment (TTT) and developed a classification model to include patients in these subgroups. Results: We identified five subgroups differing in TTT (p <0.0001). Four of them were characterized by different affected biological processes - cell adhesion, calcium-regulated signaling, synapse organization and ABC protein transport. In the last subgroup, characteristic recurrently affected pathways were not identified. Subsequently, we created a classification model that was able to determine the found subgroups based on a pathway mutation score with an accuracy of 0.77 area under the ROC curve (AUC). We used this model to evaluate our results on an independent dataset of 187 patients with somatic hypermutations in IGHV, in which we identified a similar distribution of subgroups based on our proposed mutation score. Conclusion: In a group of CLL patients with somatic hypermutations IGHV we identified prognostic subgroups based on the pathway mutation score. We believe that these results will help refine the diagnosis of CLL patients. In the future, we are going to apply the proposed procedure to our own set of whole-sequence sequencing data in CLL patients and to investigate the effect of accompanying mutations on clonal evolution of CLL.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
—
OECD FORD obor
30204 - Oncology
Návaznosti výsledku
Projekt
<a href="/cs/project/LQ1601" target="_blank" >LQ1601: CEITEC 2020</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2019
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů