Optimizing Local Satisfaction of Long-Run Average Objectives in Markov Decision Processes
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F24%3A00135875" target="_blank" >RIV/00216224:14330/24:00135875 - isvavai.cz</a>
Výsledek na webu
<a href="https://ojs.aaai.org/index.php/AAAI/article/view/29993" target="_blank" >https://ojs.aaai.org/index.php/AAAI/article/view/29993</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1609/aaai.v38i18.29993" target="_blank" >10.1609/aaai.v38i18.29993</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Optimizing Local Satisfaction of Long-Run Average Objectives in Markov Decision Processes
Popis výsledku v původním jazyce
Long-run average optimization problems for Markov decision processes (MDPs) require constructing policies with optimal steady-state behavior, i.e., optimal limit frequency of visits to the states. However, such policies may suffer from local instability in the sense that the frequency of states visited in a bounded time horizon along a run differs significantly from the limit frequency. In this work, we propose an efficient algorithmic solution to this problem.
Název v anglickém jazyce
Optimizing Local Satisfaction of Long-Run Average Objectives in Markov Decision Processes
Popis výsledku anglicky
Long-run average optimization problems for Markov decision processes (MDPs) require constructing policies with optimal steady-state behavior, i.e., optimal limit frequency of visits to the states. However, such policies may suffer from local instability in the sense that the frequency of states visited in a bounded time horizon along a run differs significantly from the limit frequency. In this work, we propose an efficient algorithmic solution to this problem.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/GA23-06963S" target="_blank" >GA23-06963S: VESCAA: Verifikovatelná a efektivní syntéza kontrolerů pro autonomní agenty</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of 38th Annual AAAI Conference on Artificial Intelligence (AAAI 2024)
ISBN
9781577358879
ISSN
2159-5399
e-ISSN
—
Počet stran výsledku
8
Strana od-do
20143-20150
Název nakladatele
AAAI Press
Místo vydání
Neuveden
Místo konání akce
Vancouver, Canada
Datum konání akce
1. 1. 2024
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
001241509500039