Advancing Large Language Model Agents through Game Playing
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
SGA0202500001
Main participants
České vysoké učení technické v Praze / Fakulta elektrotechnická
Contest type
VS - Public tender
Contract ID
25-18353S
Alternative language
Project name in Czech
Rozvoj agentů založených na velkých jazykových modelech pomocí hraní her
Annotation in Czech
Našim cílem je zlepšit schopnosti umělých inteligencí prostřednictvím kombinace velkých jazykových modelů (LLM), posilovaného učení a klasických plánovacích technik v prostředí hraní her. Náš projekt vytyčuje tři cíle: (1) rozšíření existujících algoritmů posilovaného učení učení (RL) tak, aby umožnili expertní výkon v libovolné dvouhráčové hře s nulovým součtem, a to rozšířením a adresováním omezení systémů jako jsou AlphaZero a DeepStack; (2) stavění agentů na bázi LLM, kteří prokazují neustálé samo-zlepšování, využívajíce univerzálnosti LLM pro dynamické rozhodování, lekce z posilovaného učení a přesnost formálních postupů klasického AI plánování; a (3) využití LLM pro modelování a předpovídání chování lidského oponenta ve strategických kontextech přesněji, než jak to dovolují stávající modely. Umístěním našeho výzkumu do kontextu hraní her plánujeme využít stávající herní prostředí s dostupnými referenčními řešeními a zaměřit se na robustnost chování agentů vůči jen částečně prodikovatelným akcím oponentů.
Scientific branches
R&D category
ZV - Basic research
OECD FORD - main branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - secondary branch
20205 - Automation and control systems
OECD FORD - another secondary branch
—
CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
AF - Documentation, librarianship, work with information<br>BC - Theory and management systems<br>BD - Information theory<br>IN - Informatics<br>JD - Use of computers, robotics and its application
Solution timeline
Realization period - beginning
Jan 1, 2025
Realization period - end
Dec 31, 2027
Project status
Z - Beginning multi-year project
Latest support payment
—
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP25-GA0-GA-R
Data delivery date
Feb 25, 2025
Finance
Total approved costs
7,949 thou. CZK
Public financial support
7,949 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK