Algorithmes de co-évolution pour la résolution approchée de PDM multi-agent
Les processus décisionnels de Markov (PDM) proposent un formalisme mathématique pour la résolution de problème de décision séquentielle dans l'incertain. Etudiée dans un grand nombre de situations, la résolution d'un Processus Décisionnel de Markov décentralisé n'en est pas moins, dans le cas général, NEXP-complète dès l'implication de deux agents. Nous présentons dans cet article des algorithmes de résolution approchée des problèmes PDM multi-agents décentralisés ou non. Ces méthodes de conception tirent profit de deux propriétés fondamentales de nos agents : la subjectivité et l'empathie. Tandis que la subjectivité permet de traiter les problèmes de conception de plan réactif dans des conditions de perception incomplète d'un environnement, l'empathie d'un agent permet de gérer les incertitudes de comportement de ses compères et de coordonner ses actions.
Markov Decision Processes (MDP) provide a formal approach for solving sequential decision problems under uncertainty. Decentralized Markov Decision Processes extend MDP. They are used to model the problem of several agents making decision under uncertainty. However, solving a decentralized markov decision process is NEXP-complete as soon as two agents are involved. In this paper we propose algorithms for solving approximately Multi-agent MDP problems in a centralized or decentralized way. The aim of our methods is to design a system in which agents coordinate to achieve a task in collaboration. Coordination is based on two major properties: subjectivity and empathy. While subjectivity allows an agent to deal with incomplete and local perceptions, thus to design memoryless policies, empathy allows an agent to adapt its decisions in regards with the uncertainty of the decisions of the others.
I.CHADÈS
Dec-POMDP, Dec-MDP, PDM, planification distribuée, SMA.
Dec-POMDP, Dec-MDP, PDM, distributed planning, MAS.
Français
|