Open European Family of Large Language Models
Veřejná podpora
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Program
Projekty jazykových technologií
Veřejná soutěž
8Y25001
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
RP - Spolufinancování programu EK
Číslo smlouvy
MSMT-6085/2025-8
Alternativní jazyk
Název projektu anglicky
Open European Family of Large Language Models
Anotace anglicky
Charles University (ÚFAL MFF UK) is the coordinator of the OpenEuroLLM project and will primarily work on the coordination, management and administration of the project, for which it is responsible to the European Commission, for all parts of the project. The project will build a European family of large language models (LLMs). Charles University will coordinate this project mainly within the first Workpackage (WP), i.e. WP1, including negotiations with the European Commission both formally on the project management and in the area of computing capacities and giving feedback to the European bodies. It will also participate in other WPs: in WP2 it will be co-responsible for the Open Strategic Partnership Board, in WP3 it will cooperate with other partners on the creation, legal provision and storage of data for long-term preservation, in WP4 it will provide a smaller team for integration and building of LLMs, in WP5 it will participate in the preparation of evaluation of models especially in the area of multilingualism. At the same time it will work with partners of the project and beyond to provide training and model evaluation for smaller languages. It will also participate in lectures and presentations at relevant events, meetings with stakeholders and publications and presentations at conferences (WP6, communication and dissemination). Expected results of the whole project are language models for the 37 required languages, published training data and resulting models and all mandatory Deliverables of the project, including all periodic Management Reports.
Vědní obory
Kategorie VaV
IF - Infrastruktura výzkumu, vývoje a inovací
OECD FORD - hlavní obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika
Termíny řešení
Zahájení řešení
1. 2. 2025
Ukončení řešení
31. 12. 2028
Poslední stav řešení
Z - Začínající víceletý projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP25-MSM-8Y-R
Datum dodání záznamu
6. 8. 2025
Finance
Celkové uznané náklady
94 314 tis. Kč
Výše podpory ze státního rozpočtu
47 156 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč