Konstrukce kanálů pro analýzu dat
Veřejná podpora
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Program
ERC CZ
Veřejná soutěž
SMSM2023LL001
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
MSMT-2853/2023
Alternativní jazyk
Název projektu anglicky
Engineering of Data Analysis Pipelines
Anotace anglicky
Computer science failed, as a discipline, at producing tools and methodologies that can be adopted by working data scientists. The goal of Ch-RiGiD is to identify some of the most impactful errors and to develop a methodology for rigorous engineering data analysis pipelines that can be adopted in practice. We aim to reduce the potential for errors and increase our confidence in results while retaining ease of use. Our approach is as follows: First, identify the problem by studying a large corpus of code used for data analysis. This phase of the project will contribute a classification of errors, as well as their frequencies and severity. We will develop novel program analysis techniques that blend static and dynamic analyses to account for the nature of the data science codes. Second, propose a methodology for developing data science applications that decreases errors and increases reproducibility and accountability. The outcomes here will be tools and techniques for improving the correctness of our target applications. Third, evaluate the proposal by conducting user studies. The contribution of this part of the project will be the deployment of our tools using automated techniques and the empirical evaluation of their efficacy.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika
Termíny řešení
Zahájení řešení
1. 9. 2023
Ukončení řešení
31. 8. 2028
Poslední stav řešení
B - Běžící víceletý projekt
Poslední uvolnění podpory
10. 1. 2024
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP24-MSM-LL-R
Datum dodání záznamu
15. 3. 2024
Finance
Celkové uznané náklady
52 130 tis. Kč
Výše podpory ze státního rozpočtu
52 130 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč