Algoritmická zkreslení v modelech strojového učení ve vzdělávání
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
POSTDOC INDIVIDUAL FELLOWSHIP
Veřejná soutěž
SGA0202500004
Hlavní účastníci
Masarykova univerzita / Fakulta informatiky
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
25-15839I
Alternativní jazyk
Název projektu anglicky
Algorithmic Biases in Machine Learning Models in Education
Anotace anglicky
In machine learning (ML), algorithmic bias can arise at any stage of the modeling pipeline, substantially influencing the resulting models. Previous research identified instances of bias in data and commonly used techniques. However, past work did not describe how the bias changes when parts of the ML pipeline are modified. This project aims to conduct sensitivity analysis of supervised ML models. It will investigate which model properties are influenced by which changes in the underlying data and algorithmic pipeline. I will measure what factors in the models change and how, based on manipulating variables in the ML pipeline. I will evaluate the effects of either eliminating data points, or adding synthetic data points produced by generative models, and then observe the resulting impact on the target models. The research will be conducted using human-generated data from educational contexts. The results will include a systematic description of causal effects on bias under the defined conditions. This knowledge will improve the understanding of methodological choices for ML modeling.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika
Termíny řešení
Zahájení řešení
1. 4. 2025
Ukončení řešení
31. 12. 2028
Poslední stav řešení
Z - Začínající víceletý projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP25-GA0-GN-R
Datum dodání záznamu
22. 3. 2025
Finance
Celkové uznané náklady
3 443 tis. Kč
Výše podpory ze státního rozpočtu
3 443 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč