Jilles Steeve Dibangoye

Ses 2 Articles :


Mots-clefs : Planification décentralisée
Résumé : RésuméNous nous intéréssons au problème du contrôled’un processus décisionnel de Markov décentralisé et partiellement observé (DEC - POMDP) àhorizon fini. Nous introduisons une nouvelle approche heuristique qui s’appuie sur les observations suivantes : (1) l’opération élémentairede programmation dynamique, consistant à lagénération exhaustive et l’évaluation de toutesles politiques jointes, est extrêmement prohibitive ; (2) bon nombre des politiques jointesainsi générées sont inutiles pour un contrôle optimal ou presqu’optimal. Suivant ces observations, nous proposons la première technique deconstruction incrémentale de politiques jointesà base d’états de croyance, PBIP, permettantd’éviter ces calculs intensifs. L’algorithme PBIPsurpasse les performances des meilleurs techniques approximatives actuelles sur de nombreux exemples de la littérature.

Mots-clefs : Exploration multi-robot, cartographie 3D, optimisation stochastique locale, approche frontière.
Résumé : RésuméCe papier adresse le problème de l’explorationde terrains inconnus par une flotte de drones aériens coopératifs. Nous présentons une nouvelleapproche décentralisée qui alterne explorationlocale par optimisation stochastique et exploration par frontières. L’approche permet à chaquerobot de générer une trajectoire en fonction desdonnées qu’il collecte et de la carte locale qu’ilconstruit par intégration des données partagéesentre agents. Dès que l’agent arrive dans un minimum local, correspondant à une position où ilest entouré d’espaces déjà explorés, alors l’algorithme identifie la plus proche frontière oùil se rend avant de reprendre l’optimisation locale. Avec un faible coût calculatoire, une capacité à gérer les contraintes, et une prise dedécision décentralisée, l’approche est particulièrement adaptée aux applications multi-roboten environnement complexes 3D. Les résultatsen simulation montrent que l’approche génèredes trajectoires sures et valides qui guident lesrobots pour une exploration complète de l’environnement. Par ailleurs, en terme de tempsd’exploration, notre approche est significativement meilleure que la méthode des frontièresproches. Elle fournit des temps équivalents à laméthode gloutonne centralisée tout en étant bienmoins côuteuse en calcul.