مرکز منطقه ای اطلاع رساني علوم و فناوري - Computing Optimal Stationary Policies for Multi-Objective Markov Decision Processes

DocumentCode :

2717388

Title :

Computing Optimal Stationary Policies for Multi-Objective Markov Decision Processes

Author :

Wiering, Marco A. ; De Jong, Edwin D.

Author_Institution :

Dept. of Inf. & Comput. Sci., Utrecht Univ.

fYear :

2007

fDate :

1-5 April 2007

Firstpage :

158

Lastpage :

165

Abstract :

This paper describes a novel algorithm called CON-MODP for computing Pareto optimal policies for deterministic multi-objective sequential decision problems. CON-MODP is a value iteration based multi-objective dynamic programming algorithm that only computes stationary policies. We observe that for guaranteeing convergence to the unique Pareto optimal set of deterministic stationary policies, the algorithm needs to perform a policy evaluation step on particular policies that are inconsistent in a single state that is being expanded. We prove that the algorithm converges to the Pareto optimal set of value functions and policies for deterministic infinite horizon discounted multi-objective Markov decision processes. Experiments show that CON-MODP is much faster than previous multi-objective value iteration algorithms.

Keywords :

Markov processes; Pareto optimisation; dynamic programming; Pareto optimal policies; Pareto optimal set; deterministic infinite horizon; deterministic multiobjective sequential decision problems; multiobjective Markov decision processes; multiobjective dynamic programming; multiobjective value iteration algorithms; optimal stationary policies; Convergence; Deductive databases; Distributed computing; Distributed databases; Dynamic programming; Electronic mail; Heuristic algorithms; Infinite horizon; Intelligent systems; Learning;

fLanguage :

English

Publisher :

ieee

Conference_Titel :

Approximate Dynamic Programming and Reinforcement Learning, 2007. ADPRL 2007. IEEE International Symposium on

Conference_Location :

Honolulu, HI

Print_ISBN :

1-4244-0706-0

Type :

conf

DOI :

10.1109/ADPRL.2007.368183

Filename :

4220828

Link To Document :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=49&DC=2717388