Abstract
Le game description language avec informations incomplètes (GDL-II) est assez expressif pour représenter les jeux stochastiques multi-agents avec observation partielle. Malheureusement, une telle expressivité n’est pas possible sans un prix : le problème consistant à trouver une stratégie gagnante est NExp^(NP)-hard, une classe de complexité qui est bien au-delà de la portée des solvers actuels. Dans ce papier, nous identifions un fragment Pspace-complete de GDL-II, où les agents partagent les mêmes observations (partielles). Nous montrons que ce fragment peut être encapsulé dans un problème de satisfaction de contraintes stochastiques décomposable (SCSP) qui, par tour, peut être résolu en utilisant des techniques de programmation par contraintes
usuelles. Dès lors, nous avons développé un algorithme de décisions séquentielles fondé sur les contraintes pour les jeux GDL-II exploitant la propagation par contraintes, l’évaluation Monte-Carlo et la détection de symétries. Notre algorithme, vérifié sur une large variété de jeux, surpasse aisément l’état de l’art des algorithmes du general game playing (GGP).
usuelles. Dès lors, nous avons développé un algorithme de décisions séquentielles fondé sur les contraintes pour les jeux GDL-II exploitant la propagation par contraintes, l’évaluation Monte-Carlo et la détection de symétries. Notre algorithme, vérifié sur une large variété de jeux, surpasse aisément l’état de l’art des algorithmes du general game playing (GGP).
Original language | French |
---|---|
Title of host publication | Journées Francophones de Programmation par Contraintes |
Subtitle of host publication | (JFPC'16) |
Publication status | Published - 15 Jun 2016 |
Externally published | Yes |