Construction de systèmes multi-agents par apprentissage collectif à base d'interactions
Cet article se focalise sur des approches formelles pour la construction de systèmes multi-agents et cherche à proposer des apprentissages décentralisés pour construire les comportements d'agents sociaux. Il propose un formalisme original, l'interac-DEC-POMDP inspiré des modèles markoviens au sein duquel les agents peuvent interagir directement et localement entre eux. A partir de ce formalisme, cet article propose un algorithme d'apprentissage décentralisé fondé sur une répartition heuristique des gains des agents au cours des interactions. Une démarche expérimentale valide sa capacité à produire automatiquement des comportements collectifs. Les techniques présentées pourraient alors constituer des moyens permettant aux agents de décider automatiquement et de manière décentralisée comment s'organiser avec les autres pour résoudre un problème donné.
This article deals with formal approaches to build multi-agent systems. The goal of the conducted works was to propose decentralized learning techniques to build the bejavior of social agents. This article presents an original formalism, the interac-DECPOMDP, in which agents can directly interact. On the basis of this formalism, this article proposes a decentralized learning algorithm based on a heuristic distribution of rewards during interactions. Experiments have validated its ability to automatically build collective behaviors. The presented techniques could then constitute a mean to operationalize selforganization in order to solve problems.
V.THOMAS, C.BOURJOT, V.CHEVRIER
systèmes multi-agents, apprentissage collectif, interaction, modèle markovien.
Multi-agent systems, collective learning, interaction, markov models.
Français
|