LEARNING BASED CONTROL SYSTEM OF FOUR-LEGGED ROBOT
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26210%2F02%3APU30854" target="_blank" >RIV/00216305:26210/02:PU30854 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
LEARNING BASED CONTROL SYSTEM OF FOUR-LEGGED ROBOT
Popis výsledku v původním jazyce
Possible discretization technique of the continuous state space of four-legged robot using simultaneous compositions of behaviors is described in this contribution. Compositions are generated by the instances of two basic controllers. The aim is to automatically develop the gait policy. Possible composition strategies are implemented through undeterministic state machine. In the machine design stage the number of both machine states and transitions could be essetially reduced using formal considerationss only. Furthermore machine transitions are evaluated by selected alternative of Q-learning to incrementally improve the estimation of the future benefit from single transitions. This technique results in simultaneous activations of controller compositions instances with the highest estimation of the future benefit.
Název v anglickém jazyce
LEARNING BASED CONTROL SYSTEM OF FOUR-LEGGED ROBOT
Popis výsledku anglicky
Possible discretization technique of the continuous state space of four-legged robot using simultaneous compositions of behaviors is described in this contribution. Compositions are generated by the instances of two basic controllers. The aim is to automatically develop the gait policy. Possible composition strategies are implemented through undeterministic state machine. In the machine design stage the number of both machine states and transitions could be essetially reduced using formal considerationss only. Furthermore machine transitions are evaluated by selected alternative of Q-learning to incrementally improve the estimation of the future benefit from single transitions. This technique results in simultaneous activations of controller compositions instances with the highest estimation of the future benefit.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2002
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Inženýrská mechanika 2002
ISBN
80-214-2109-6
ISSN
—
e-ISSN
—
Počet stran výsledku
2
Strana od-do
9-10
Název nakladatele
Institute of Mechanics of Solids, Faculty of Mechanical Engineering, Brno University of Technology
Místo vydání
Brno
Místo konání akce
Svratka
Datum konání akce
13. 5. 2002
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—