Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Symbolická regrese pro posilované učení ve spojitých prostorech

Veřejná podpora

  • Poskytovatel

    Grantová agentura České republiky

  • Program

    Standardní projekty

  • Veřejná soutěž

    Standardní projekty 19 (SGA0201500001)

  • Hlavní účastníci

    České vysoké učení technické v Praze / Český institut informatiky, robotiky a kybernetiky

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    15-22731S

Alternativní jazyk

  • Název projektu anglicky

    Symbolic Regression for Reinforcement Learning in Continuous Spaces

  • Anotace anglicky

    Reinforcement Learning (RL) algorithms can optimally solve dynamic decision and control problems in engineering, economics, medicine, artificial intelligence and other disciplines. However, state-of-the-art RL methods still have not solved the transition from a small set of discrete states to large or continuous state spaces. They have to rely on function approximators, such as radial basis functions, to represent the value function and policy mappings. The choice of a suitable approximator, in terms of its structure is a difficult step which always requires significant trial-and-error tuning. The goal of the project is to automate the search process for the value function and policy approximator, so that it becomes an integral part of the learning procedure. We will further develop symbolic regression, a technique based on genetic programming, so that it can automatically find analytic functions representing the policy and value function mappings with the RL framework. The result will be a new class of RL methods suitable for continuous, high-dimensional state and action spaces.

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • CEP - hlavní obor

    JD - Využití počítačů, robotika a její aplikace

  • CEP - vedlejší obor

  • CEP - další vedlejší obor

  • OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)

    20204 - Robotics and automatic control<br>20205 - Automation and control systems

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Zhodnocení výsledků projektu

    Projekt přináší řadu poznatků v teorii, návrhů a experimentálních ověření fúze genetického programování a reinforcement learningu – především pro dynamické aplikace v oblasti řízení a robotiky. Toto je podloženo řadou příspěvků na uznávaných konferencích a několika málo časopiseckých publikací. Nebyly zjištěny nedostatky v čerpání financí či pravidel řešení grantového projektu.

Termíny řešení

  • Zahájení řešení

    1. 1. 2015

  • Ukončení řešení

    29. 11. 2019

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    4. 5. 2016

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP20-GA0-GA-U/01:1

  • Datum dodání záznamu

    2. 7. 2020

Finance

  • Celkové uznané náklady

    5 920 tis. Kč

  • Výše podpory ze státního rozpočtu

    5 920 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč