Využití Q-učení pro řízení nestacionární soustavy
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26210%2F05%3APU51483" target="_blank" >RIV/00216305:26210/05:PU51483 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Využití Q-učení pro řízení nestacionární soustavy
Popis výsledku v původním jazyce
Metoda Q-učení patří mezi velice populární učicí se algoritmy. V tomto článku je ukázáno jak je možné použít tuto metodu pro řízení nestacionární soustavy. Jako modelová soustava slouží velice jednoduchý model inversního kyvadla s proměnnou délkou kyvadla.
Název v anglickém jazyce
Nonstationary system control using Q-learning
Popis výsledku anglicky
Q-learning is the most popular and effective version of reinforcement Learning algorithms. In this paper we discuss the possibility of control of a nonstationary system by Q-learning. the non-stationary system is represented by simple inverted pendulum simulation model with variable pendulum length.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
BC - Teorie a systémy řízení
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2005
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Engineering mechanics 2005
ISBN
80-85918-93-5
ISSN
—
e-ISSN
—
Počet stran výsledku
2
Strana od-do
333-334
Název nakladatele
Institute of Thermomechanics, Academy of Sciences of the Czech Republic
Místo vydání
Praha
Místo konání akce
Svratka
Datum konání akce
9. 5. 2005
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—