Reinforcement Structural Learning
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F15%3A10318695" target="_blank" >RIV/00216208:11320/15:10318695 - isvavai.cz</a>
Výsledek na webu
<a href="http://wupes.fm.vse.cz/2015/data/Proceedings.pdf" target="_blank" >http://wupes.fm.vse.cz/2015/data/Proceedings.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Reinforcement Structural Learning
Popis výsledku v původním jazyce
This article shows a novel approach to modelling and reinforcement learning of dynamic stochastic partially observable environment. We present an MCMC algorithm which learns the structure of a graphical model representing the environment. We use an approximation to a Bayesian method to learn posterior distribution over parameters of learned structure. The learning algorithm is online which allows us to use it in reinforcement learning setup. We demonstrate that this algorithm is usable on several simpleexperiments.
Název v anglickém jazyce
Reinforcement Structural Learning
Popis výsledku anglicky
This article shows a novel approach to modelling and reinforcement learning of dynamic stochastic partially observable environment. We present an MCMC algorithm which learns the structure of a graphical model representing the environment. We use an approximation to a Bayesian method to learn posterior distribution over parameters of learned structure. The learning algorithm is online which allows us to use it in reinforcement learning setup. We demonstrate that this algorithm is usable on several simpleexperiments.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GAP103%2F10%2F1287" target="_blank" >GAP103/10/1287: PlanEx: Propojení plánování a provádění plánů</a><br>
Návaznosti
S - Specificky vyzkum na vysokych skolach<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů