Rozvoj agentů založených na velkých jazykových modelech pomocí hraní her
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
SGA0202500001
Hlavní účastníci
České vysoké učení technické v Praze / Fakulta elektrotechnická
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
25-18353S
Alternativní jazyk
Název projektu anglicky
Advancing Large Language Model Agents through Game Playing
Anotace anglicky
We target the enhancement of AI agents through the integration of Large Language Models (LLMs) with reinforcement learning and classical AI planning techniques in the domain of game playing. Our project outlines three objectives: (1) advancing a reinforcement learning (RL) solver to allow for mastering an arbitrary two-player zero-sum game, building upon and addressing the limitations of existing systems such as AlphaZero and DeepStack; (2) constructing LLM-based agents that demonstrate continuous self-improvement, leveraging the generality of LLMs for dynamic decision-making, lessons from case-based reasoning and the rigor of AI planning formalisms; and (3) employing LLMs to model and anticipate human opponent behavior in strategic contexts more accurately than current models allow. By situating our research within the game-playing context, we aim to leverage existing evaluation environments with available baselines and focus on robustness of agent’s behavior to only partially predictable actions of the opponents.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - vedlejší obor
20205 - Automation and control systems
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika<br>JD - Využití počítačů, robotika a její aplikace
Termíny řešení
Zahájení řešení
1. 1. 2025
Ukončení řešení
31. 12. 2027
Poslední stav řešení
Z - Začínající víceletý projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP25-GA0-GA-R
Datum dodání záznamu
25. 2. 2025
Finance
Celkové uznané náklady
7 949 tis. Kč
Výše podpory ze státního rozpočtu
7 949 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč