Q-LEARNING APPLICATION ON FOUR-LEGGED ROBOT WALKING CONTROL
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26210%2F03%3APU37382" target="_blank" >RIV/00216305:26210/03:PU37382 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Q-LEARNING APPLICATION ON FOUR-LEGGED ROBOT WALKING CONTROL
Popis výsledku v původním jazyce
Significant goal in walking robot design is realisation of autonomous system which is capable of motion in unknown environment. One of the possibilities how to reach necessary adaptability of control system without modelling the complex and unpredictablecases of system behaviour is the application of Q-learning. The contribution describes experiences with the use of Q-learning through discretization of continuous state space of four legged robot. Q-learning is applied to realization of simultaneous commpositions of behaviours. These compositions are obtained by concurrent activations of two simple basic controllers instances and . Control process is created by optimization procedure that operates with penalty function with global minimum in control target.
Název v anglickém jazyce
Q-LEARNING APPLICATION ON FOUR-LEGGED ROBOT WALKING CONTROL
Popis výsledku anglicky
Significant goal in walking robot design is realisation of autonomous system which is capable of motion in unknown environment. One of the possibilities how to reach necessary adaptability of control system without modelling the complex and unpredictablecases of system behaviour is the application of Q-learning. The contribution describes experiences with the use of Q-learning through discretization of continuous state space of four legged robot. Q-learning is applied to realization of simultaneous commpositions of behaviours. These compositions are obtained by concurrent activations of two simple basic controllers instances and . Control process is created by optimization procedure that operates with penalty function with global minimum in control target.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of 6th international symposium on Mechatronics
ISBN
80-88914-92-2
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
66-69
Název nakladatele
Alexander Dubček University of Trenčín, Faculty of Mechatronics, Trenčín, SLOVAKIA
Místo vydání
Trenčín, SK
Místo konání akce
Trenčanské Teplice, SLOVAKIA
Datum konání akce
18. 6. 2003
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—