Growth Rates and Average Optimality in Risk-Sensitive Markov Decision Chains
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F67985556%3A_____%2F08%3A00309471" target="_blank" >RIV/67985556:_____/08:00309471 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Growth Rates and Average Optimality in Risk-Sensitive Markov Decision Chains
Original language description
In this note we focus attention on characterization of policies maximizing growth rate of expected utility, along with average of the associated certainty equivalent, in risk-sensitive Markov decision chains with finite state and action spaces. In contrast to existing literature, the problem is handled by methods of stochastic dynamic programming on condition that the transition probabilities are replaced by general nonnegative matrices. Using the block-triangular decomposition of a collection of nonnegative matrices we establish necessary and sufficient condition guaranteeing independence of optimal values on starting state along with partition of the state space into subsets with constant optimal values. Finally for models with growth rate independent of the starting state we show how the method work if we minimize growth rate or average of the certainty equivalent.
Czech name
Míry růstu a optimality v průměru v rizikových markovských rozhodovacích řetězcích
Czech description
V práci je charakterizována třída řízení, která maximalizuje míru růstu i průměrný růst přidruženého ekvivalentu za jistoty v rizikových markovských rozhodovacích řetězcích. Na rozdíl od literatury úloha je řešena metodami stochastického dynamického programování, kde matrice pravděpodobností přechodů jsou nahrazeny obecnými nezápornými maticemi. Využitím blokově trojúhelníkového rozkladu třídy nezáproných matic jsou nalezeny nutné a postačujících podmínky pro nezávislost optimálních hodnot na počátečnímstavu, jakož i rozklad stavového prostoru na třídy s konstatními optimálními hodnotami. Pro modely, kde je míra růstu nezávislá na počátečním stavu, je v zhávěru práce ikázáno, jak lze výše uvedené metody modifikovat při hledání minimální míry růstu nebo odpovídajícího průměrného ekvivalentu za jistoty.
Classification
Type
J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)
CEP classification
BC - Theory and management systems
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Kybernetika
ISSN
0023-5954
e-ISSN
—
Volume of the periodical
44
Issue of the periodical within the volume
2
Country of publishing house
CZ - CZECH REPUBLIC
Number of pages
22
Pages from-to
—
UT code for WoS article
000257062200006
EID of the result in the Scopus database
—