Use of continous action reinforcement learning automata for asynchronous electromotro control
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26210%2F04%3APU45626" target="_blank" >RIV/00216305:26210/04:PU45626 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Use of continous action reinforcement learning automata for asynchronous electromotro control
Popis výsledku v původním jazyce
Relatively unknown reinforcement learning algorithm, so called continuous action reinforcement learning automaton, is presented in this contribution. Automaton learning algorithm is based on rewarding, that gradually evolves set of probability densities.This set is consequently used for action set determination. Simulation study describing learning and behavior of asynchronous electromotor control is further presented. Standard PSD controller is used whose parameter values represent actions of three independent automata. The aim of online learning process is to minimize mean square of control error. Here described learning algorithm is simple to implement, robust to high level of noise.
Název v anglickém jazyce
Use of continous action reinforcement learning automata for asynchronous electromotro control
Popis výsledku anglicky
Relatively unknown reinforcement learning algorithm, so called continuous action reinforcement learning automaton, is presented in this contribution. Automaton learning algorithm is based on rewarding, that gradually evolves set of probability densities.This set is consequently used for action set determination. Simulation study describing learning and behavior of asynchronous electromotor control is further presented. Standard PSD controller is used whose parameter values represent actions of three independent automata. The aim of online learning process is to minimize mean square of control error. Here described learning algorithm is simple to implement, robust to high level of noise.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
V - Vyzkumna aktivita podporovana z jinych verejnych zdroju
Ostatní
Rok uplatnění
2004
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Enigneering Mechanics 2004, National Conference with International Participation
ISBN
80-85918-88-9
ISSN
—
e-ISSN
—
Počet stran výsledku
2
Strana od-do
—
Název nakladatele
Institute of Thermomechanics, Academy of Sciences of the Czec Republic
Místo vydání
Svratka
Místo konání akce
Svratka
Datum konání akce
10. 5. 2004
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—