Symbolická regrese pro posilované učení ve spojitých prostorech
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
Standardní projekty 19 (SGA0201500001)
Hlavní účastníci
České vysoké učení technické v Praze / Český institut informatiky, robotiky a kybernetiky
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
15-22731S
Alternativní jazyk
Název projektu anglicky
Symbolic Regression for Reinforcement Learning in Continuous Spaces
Anotace anglicky
Reinforcement Learning (RL) algorithms can optimally solve dynamic decision and control problems in engineering, economics, medicine, artificial intelligence and other disciplines. However, state-of-the-art RL methods still have not solved the transition from a small set of discrete states to large or continuous state spaces. They have to rely on function approximators, such as radial basis functions, to represent the value function and policy mappings. The choice of a suitable approximator, in terms of its structure is a difficult step which always requires significant trial-and-error tuning. The goal of the project is to automate the search process for the value function and policy approximator, so that it becomes an integral part of the learning procedure. We will further develop symbolic regression, a technique based on genetic programming, so that it can automatically find analytic functions representing the policy and value function mappings with the RL framework. The result will be a new class of RL methods suitable for continuous, high-dimensional state and action spaces.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
CEP - hlavní obor
JD - Využití počítačů, robotika a její aplikace
CEP - vedlejší obor
—
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
20204 - Robotics and automatic control<br>20205 - Automation and control systems
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Projekt přináší řadu poznatků v teorii, návrhů a experimentálních ověření fúze genetického programování a reinforcement learningu – především pro dynamické aplikace v oblasti řízení a robotiky. Toto je podloženo řadou příspěvků na uznávaných konferencích a několika málo časopiseckých publikací. Nebyly zjištěny nedostatky v čerpání financí či pravidel řešení grantového projektu.
Termíny řešení
Zahájení řešení
1. 1. 2015
Ukončení řešení
29. 11. 2019
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
4. 5. 2016
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP20-GA0-GA-U/01:1
Datum dodání záznamu
2. 7. 2020
Finance
Celkové uznané náklady
5 920 tis. Kč
Výše podpory ze státního rozpočtu
5 920 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč