Payoff size variation problem in simple reinforcement learning algorithms
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14560%2F13%3A00074742" target="_blank" >RIV/00216224:14560/13:00074742 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Payoff size variation problem in simple reinforcement learning algorithms
Popis výsledku v původním jazyce
This paper shows that the speed of the reinforcement learning depends on the size of the payoffs, at least when all payoffs are positive. When the speed of learning is too fast, the agents tend to learn to play the actions which they randomly chosen in the first rounds of the learning process. The compositions of the agents? strategies then on the aggregate level resembles the initial individual agent?s mixed strategy. This may create artificial effects in the simulations where the size of payoffs depend on the model treatments because the speed of learning cannot be tuned in.
Název v anglickém jazyce
Payoff size variation problem in simple reinforcement learning algorithms
Popis výsledku anglicky
This paper shows that the speed of the reinforcement learning depends on the size of the payoffs, at least when all payoffs are positive. When the speed of learning is too fast, the agents tend to learn to play the actions which they randomly chosen in the first rounds of the learning process. The compositions of the agents? strategies then on the aggregate level resembles the initial individual agent?s mixed strategy. This may create artificial effects in the simulations where the size of payoffs depend on the model treatments because the speed of learning cannot be tuned in.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
AH - Ekonomie
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 31st International Conference Mathematical Methods in Economics 2013
ISBN
9788087035764
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
518-523
Název nakladatele
College of Polytechnics Jihlava
Místo vydání
Jihlava
Místo konání akce
Jihlava
Datum konání akce
1. 1. 2013
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
000335578000088