Adaptive Proposer for Ultimatum Game
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F67985556%3A_____%2F16%3A00462888" target="_blank" >RIV/67985556:_____/16:00462888 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-319-44778-0_39" target="_blank" >http://dx.doi.org/10.1007/978-3-319-44778-0_39</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-44778-0_39" target="_blank" >10.1007/978-3-319-44778-0_39</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Adaptive Proposer for Ultimatum Game
Popis výsledku v původním jazyce
Ultimate Game serves for extensive studies of various aspects of human decision making. The current paper contribute to them by designing proposer optimising its policy using Markov-decision-process (MDP) framework combined with recursive Bayesian learning of responder’s model. Its foreseen use: i) standardises experimental conditions for studying rationality and emotion-influenced decision making of human responders; ii) replaces the classical game-theoretical design of the players’ policies by an adaptive MDP, which is more realistic with respect to the knowledge available to individual players and decreases player’s deliberation effort; iii) reveals the need for approximate learning and dynamic programming inevitable for coping with the curse of dimensionality; iv) demonstrates the influence of the fairness attitude of the proposer on the game course; v) prepares the test case for inspecting exploration-exploitation dichotomy.
Název v anglickém jazyce
Adaptive Proposer for Ultimatum Game
Popis výsledku anglicky
Ultimate Game serves for extensive studies of various aspects of human decision making. The current paper contribute to them by designing proposer optimising its policy using Markov-decision-process (MDP) framework combined with recursive Bayesian learning of responder’s model. Its foreseen use: i) standardises experimental conditions for studying rationality and emotion-influenced decision making of human responders; ii) replaces the classical game-theoretical design of the players’ policies by an adaptive MDP, which is more realistic with respect to the knowledge available to individual players and decreases player’s deliberation effort; iii) reveals the need for approximate learning and dynamic programming inevitable for coping with the curse of dimensionality; iv) demonstrates the influence of the fairness attitude of the proposer on the game course; v) prepares the test case for inspecting exploration-exploitation dichotomy.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
BB - Aplikovaná statistika, operační výzkum
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA13-13502S" target="_blank" >GA13-13502S: Plně pravděpodobností návrh dynamických rozhodovacích strategií s nedokonalými účastníky v tržních scénářích</a><br>
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Artificial Neural Networks and Machine Learning – ICANN 2016
ISBN
978-3-319-44777-3
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
8
Strana od-do
330-338
Název nakladatele
Springer
Místo vydání
Cham
Místo konání akce
Barcelona
Datum konání akce
6. 9. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000389086300039