Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Payoff size variation problem in simple reinforcement learning algorithms

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14560%2F13%3A00074742" target="_blank" >RIV/00216224:14560/13:00074742 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Payoff size variation problem in simple reinforcement learning algorithms

  • Popis výsledku v původním jazyce

    This paper shows that the speed of the reinforcement learning depends on the size of the payoffs, at least when all payoffs are positive. When the speed of learning is too fast, the agents tend to learn to play the actions which they randomly chosen in the first rounds of the learning process. The compositions of the agents? strategies then on the aggregate level resembles the initial individual agent?s mixed strategy. This may create artificial effects in the simulations where the size of payoffs depend on the model treatments because the speed of learning cannot be tuned in.

  • Název v anglickém jazyce

    Payoff size variation problem in simple reinforcement learning algorithms

  • Popis výsledku anglicky

    This paper shows that the speed of the reinforcement learning depends on the size of the payoffs, at least when all payoffs are positive. When the speed of learning is too fast, the agents tend to learn to play the actions which they randomly chosen in the first rounds of the learning process. The compositions of the agents? strategies then on the aggregate level resembles the initial individual agent?s mixed strategy. This may create artificial effects in the simulations where the size of payoffs depend on the model treatments because the speed of learning cannot be tuned in.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

    AH - Ekonomie

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    S - Specificky vyzkum na vysokych skolach

Ostatní

  • Rok uplatnění

    2013

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    Proceedings of the 31st International Conference Mathematical Methods in Economics 2013

  • ISBN

    9788087035764

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    6

  • Strana od-do

    518-523

  • Název nakladatele

    College of Polytechnics Jihlava

  • Místo vydání

    Jihlava

  • Místo konání akce

    Jihlava

  • Datum konání akce

    1. 1. 2013

  • Typ akce podle státní příslušnosti

    EUR - Evropská akce

  • Kód UT WoS článku

    000335578000088