Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Rozvoj agentů založených na velkých jazykových modelech pomocí hraní her

Veřejná podpora

  • Poskytovatel

    Grantová agentura České republiky

  • Program

    Standardní projekty

  • Veřejná soutěž

    SGA0202500001

  • Hlavní účastníci

    České vysoké učení technické v Praze / Fakulta elektrotechnická

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    25-18353S

Alternativní jazyk

  • Název projektu anglicky

    Advancing Large Language Model Agents through Game Playing

  • Anotace anglicky

    We target the enhancement of AI agents through the integration of Large Language Models (LLMs) with reinforcement learning and classical AI planning techniques in the domain of game playing. Our project outlines three objectives: (1) advancing a reinforcement learning (RL) solver to allow for mastering an arbitrary two-player zero-sum game, building upon and addressing the limitations of existing systems such as AlphaZero and DeepStack; (2) constructing LLM-based agents that demonstrate continuous self-improvement, leveraging the generality of LLMs for dynamic decision-making, lessons from case-based reasoning and the rigor of AI planning formalisms; and (3) employing LLMs to model and anticipate human opponent behavior in strategic contexts more accurately than current models allow. By situating our research within the game-playing context, we aim to leverage existing evaluation environments with available baselines and focus on robustness of agent’s behavior to only partially predictable actions of the opponents.

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • OECD FORD - hlavní obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

  • OECD FORD - vedlejší obor

    20205 - Automation and control systems

  • OECD FORD - další vedlejší obor

  • CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)

    AF - Dokumentace, knihovnictví, práce s informacemi<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika<br>JD - Využití počítačů, robotika a její aplikace

Termíny řešení

  • Zahájení řešení

    1. 1. 2025

  • Ukončení řešení

    31. 12. 2027

  • Poslední stav řešení

    Z - Začínající víceletý projekt

  • Poslední uvolnění podpory

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP25-GA0-GA-R

  • Datum dodání záznamu

    25. 2. 2025

Finance

  • Celkové uznané náklady

    7 949 tis. Kč

  • Výše podpory ze státního rozpočtu

    7 949 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč