Conditions générales pour l'admissibilité de la programmation dynamique dans la décision séquentielle possibiliste
Nous nous intéressons à la contrepartie possibiliste des processus de décision markoviens. À l'instar du modèle classique, trois relations de préférence peuvent être distinguées (préférences sur les chemins, sur les loteries et sur les politiques). Nous énonçons des propriétés simples et suffisantes (transitivité, invariance par translation, indépendance) sur la relation de préférence sur les loteries pour permettre l'utilisation de méthodes fondées sur la programmation dynamique. Nous fournissons enfin un exemple d'application de ces résultats avec l'utilité bipolaire possibiliste.
We are interested here in the possibilistic counterpart of Markov decision processes. Like in the standard model, three preference relations can be distinguished (preferences over paths, over lotteries and over policies). We state some simple and sufficient properties (transitivity, invariance by translation, independence) on the preference relation over lotteries to allow the application of techniques based on dynamic programming. Finally we provide an example illustrating the interest of these results with binary possibilistic utility.
P.WENG
processus de décision markoviens, théorie des possibilités, préférence qualitative, programmation dynamique.
Markov decision process, possibility theory, qualitative preference, dynamic programming.
Français
|