All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”
8Y25001

Open European Family of Large Language Models

Public support

  • Provider

    Ministry of Education, Youth and Sports

  • Programme

  • Call for proposals

    8Y25001

  • Main participants

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Contest type

    RP - Co-financing of EC programme

  • Contract ID

    MSMT-6085/2025-8

Alternative language

  • Project name in Czech

    Open European Family of Large Language Models

  • Annotation in Czech

    Univerzita Karlova (ÚFAL MFF UK) je koordinátorem projektu OpenEuroLLM, a bude se především zabývat koordinací, managementem a administrativou projektu, za který je zodpovědná Evropské komisi, a to za všechny části projektu. Projekt vybuduje evropskou rodinu velkých jazykových modelů (LLM). Univerzita Karlova bude koordinaci tohoto projektu vykonávat především v prvním pracovním balíčku (Workpackage, WP), tedy WP1, a to včetně jednání s Evropskou komisí jak formálně ohledně řízení projektu, tak v oblasti zajištění výpočetních kapacit a zpětné vazby pro evropské orgány. Bude se zároveň podílet i na dalších WP: ve WP2 bude spoluodpovědná za tzv. Open Strategic Partnership Board, ve WP3 bude spolupracovat s ostatními partnery na tvorbě, právním zajištění a uchovávání dat pro dlouhodobé uložení, ve WP4 poskytne menší tým pro integraci a budování LLM, ve WP5 se bude podílet na přípravě evaluace modelů zejména v oblasti multilingvality. Zároveň bude spolupracovat s partnery projektu i mimo něj na zajištění trénování a evaluace modelů pro menší jazyky. Bude se rovněž podílet přednáškami a vystoupeními na relevantních akcích, jednáním se zainteresovanými stranami a publikacemi a prezentacemi na konferencích na WP6 (komunikace a diseminace). Očekávanými výsledky celého projektu jsou jazykové modely pro 37 předepsaných jazyků, zveřejněná trénovací data a výsledné modely a veškeré povinné Deliverables projektu, včetně všech periodických zpráv.

Scientific branches

  • R&D category

    IF - RDI infrastructure

  • OECD FORD - main branch

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

  • OECD FORD - secondary branch

  • OECD FORD - another secondary branch

  • CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    AF - Documentation, librarianship, work with information<br>BC - Theory and management systems<br>BD - Information theory<br>IN - Informatics

Solution timeline

  • Realization period - beginning

    Feb 1, 2025

  • Realization period - end

    Dec 31, 2028

  • Project status

    Z - Beginning multi-year project

  • Latest support payment

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP25-MSM-8Y-R

  • Data delivery date

    Aug 6, 2025

Finance

  • Total approved costs

    94,314 thou. CZK

  • Public financial support

    47,156 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK