Genomická formace indoevropanů: nové přístupy k modelování genetického mísení řízené simulovanými daty.
Cíle projektu
Obor lidské archeogenetiky právě prochází obrovským růstem a sekvenují se tisíce starověkých jedinců ročně. Zatímco protokoly pro sekvenování starobylé DNA se staly standardizovanými a dosáhly až průmyslového měřítka, standardizace protokolů pro analýzu dat zatím chybí. Největší pozornost byla doposud zaměřena na Neolit a pozdější období v západní Eurasii. Tato oblast je charakteristická vysokou mírou pohybu a míšením různých skupin lidí, což činí analýzu genetických dat komplexním problémem. Klíčové výsledky o genetickém původu lidí mluvících Indo-Evropskými jazyky byly získány pomocí populárního algoritmu pro modelování mísení populací qpAdm, který však nikdy nebyl testován na realisticky komplexních simulacích. Naše předběžné výsledky ukazují, že běžné protokoly qpAdm vedou k vysokým falešně pozitivním hodnotám protože předpoklady metody jsou často porušovány. Navrhujeme optimalizovat protokoly qpAdm s využitím simulovaných dat a pak ověřit klíčové objevy o historii Indoevropanů, a pomocí grafu mísení a qpAdm získat nové výsledky o genetickém původu lidí Jámové kultury.
Klíčová slova
archaeogeneticsgenetic admixtureqpAdmsimulated genetic dataWest EurasiaIndo-Europeans
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
SGA0202100005
Hlavní účastníci
Ostravská univerzita / Přírodovědecká fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
21-27624S
Alternativní jazyk
Název projektu anglicky
Genomic formation of Indo-Europeans: new approaches to genetic admixture modelling guided by simulated data.
Anotace anglicky
Human archaeogenetics is undergoing explosive growth, with thousands of ancient individuals sequenced per year. While ancient DNA sequencing protocols became standardized and reached industrial scale, standardization of data analysis protocols is conspicuously lacking. To date by far the most attention was focused on the Neolithic and later periods in West Eurasia, characterized by high mobility and admixture of people, hence tasks facing a genetic data analyst in this area are inherently complex. Key results on the genetic origin of Indo-European speakers were obtained using qpAdm, a popular admixture modelling algorithm that has never been tested on realistically complex simulated histories. Our preliminary results show that common qpAdm protocols result in very high false positive rates since method assumptions are often violated. We propose to optimize qpAdm protocols on simulated data, then verify key findings on the history of Indo-Europeans and advance our understanding of the genetic origin of the Yamnaya culture people using qpAdm and admixture graphs.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
10603 - Genetics and heredity (medical genetics to be 3)
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory
(dle převodníku)EB - Genetika a molekulární biologie
Termíny řešení
Zahájení řešení
1. 1. 2021
Ukončení řešení
30. 6. 2024
Poslední stav řešení
—
Poslední uvolnění podpory
1. 4. 2024
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP25-GA0-GA-R
Datum dodání záznamu
12. 3. 2025
Finance
Celkové uznané náklady
5 190 tis. Kč
Výše podpory ze státního rozpočtu
5 190 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
5 190 tis. Kč
Statní podpora
5 190 tis. Kč
100%
Poskytovatel
Grantová agentura České republiky
OECD FORD
Genetics and heredity (medical genetics to be 3)
Doba řešení
01. 01. 2021 - 30. 06. 2024