USAGE OF LEARNING IN FOUR-LEGGED ROBOT CONTROL
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26210%2F02%3APU30856" target="_blank" >RIV/00216305:26210/02:PU30856 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
USAGE OF LEARNING IN FOUR-LEGGED ROBOT CONTROL
Popis výsledku v původním jazyce
The report describes a possible method of discretization of the continuous status space of the four-legged robot using simultaneous compositions of effects of basic control elements. The compositions are activated from a non-deterministic terminal automatic machine. In the design stage it is possible to use simple considerations for significant limitation of the number of statuses of the terminal automatic machines and the number of possible simultaneous compositions. The valuation of transfers of the tterminal automatic machine corresponds with compositions of control elements. For such a prepared scheme of transfers there is applied the variant of Q-learning so as to gradually specify the estimation of the future benefit from individual transfers andso as there are activated the simultaneous compositions of control elements with the maximal estimation of future benefit.
Název v anglickém jazyce
USAGE OF LEARNING IN FOUR-LEGGED ROBOT CONTROL
Popis výsledku anglicky
The report describes a possible method of discretization of the continuous status space of the four-legged robot using simultaneous compositions of effects of basic control elements. The compositions are activated from a non-deterministic terminal automatic machine. In the design stage it is possible to use simple considerations for significant limitation of the number of statuses of the terminal automatic machines and the number of possible simultaneous compositions. The valuation of transfers of the tterminal automatic machine corresponds with compositions of control elements. For such a prepared scheme of transfers there is applied the variant of Q-learning so as to gradually specify the estimation of the future benefit from individual transfers andso as there are activated the simultaneous compositions of control elements with the maximal estimation of future benefit.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2002
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
SEKEL 2002
ISBN
80-88914-73-6
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
87-90
Název nakladatele
Trenčianská univerzita Alexandra Dubčeka v Trenčíně
Místo vydání
Trenčín
Místo konání akce
Trenčianské Teplice
Datum konání akce
24. 9. 2002
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—