All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Advancing Large Language Model Agents through Game Playing

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    SGA0202500001

  • Main participants

    České vysoké učení technické v Praze / Fakulta elektrotechnická

  • Contest type

    VS - Public tender

  • Contract ID

    25-18353S

Alternative language

  • Project name in Czech

    Rozvoj agentů založených na velkých jazykových modelech pomocí hraní her

  • Annotation in Czech

    Našim cílem je zlepšit schopnosti umělých inteligencí prostřednictvím kombinace velkých jazykových modelů (LLM), posilovaného učení a klasických plánovacích technik v prostředí hraní her. Náš projekt vytyčuje tři cíle: (1) rozšíření existujících algoritmů posilovaného učení učení (RL) tak, aby umožnili expertní výkon v libovolné dvouhráčové hře s nulovým součtem, a to rozšířením a adresováním omezení systémů jako jsou AlphaZero a DeepStack; (2) stavění agentů na bázi LLM, kteří prokazují neustálé samo-zlepšování, využívajíce univerzálnosti LLM pro dynamické rozhodování, lekce z posilovaného učení a přesnost formálních postupů klasického AI plánování; a (3) využití LLM pro modelování a předpovídání chování lidského oponenta ve strategických kontextech přesněji, než jak to dovolují stávající modely. Umístěním našeho výzkumu do kontextu hraní her plánujeme využít stávající herní prostředí s dostupnými referenčními řešeními a zaměřit se na robustnost chování agentů vůči jen částečně prodikovatelným akcím oponentů.

Scientific branches

  • R&D category

    ZV - Basic research

  • OECD FORD - main branch

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

  • OECD FORD - secondary branch

    20205 - Automation and control systems

  • OECD FORD - another secondary branch

  • CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    AF - Documentation, librarianship, work with information<br>BC - Theory and management systems<br>BD - Information theory<br>IN - Informatics<br>JD - Use of computers, robotics and its application

Solution timeline

  • Realization period - beginning

    Jan 1, 2025

  • Realization period - end

    Dec 31, 2027

  • Project status

    Z - Beginning multi-year project

  • Latest support payment

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP25-GA0-GA-R

  • Data delivery date

    Feb 25, 2025

Finance

  • Total approved costs

    7,949 thou. CZK

  • Public financial support

    7,949 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK