AUTEURS – jfsma30ans

François Charpillet

Ses 11 Articles :

1997 Progress : un modèle d'agent pour la conception de systèmes multi-agents temps réel

Mots-clefs :

Résumé : Les techniques d'Intelligence Artificielle constituent une approche intéressante pour automatiser des applications comme le contrôle de processus, l'assistance médicale ou la robotiue. La plupart de ces applications sont de nature temps réel. Alors que le temps réel nécessite des opérations continues et prédictibles, les techniques issues de l'Intelligence Artificielle mettent en oeuvre des algorithmes coûteux en temps, avec des performances imprévisibles et fortement variables. Mais si la vitesse d'exécution est bien évidemment un paramètre essentiel dans la conception de systèmes temps réel, ce n'est pas le seul. Comme indiqué dans [DOD 891, la capacité d'un système à respecter ses dates limites d'exécution, sa réactivité face aux événements nouveaux qui se produisent, sa capacité à réévaluer les priorités en fonction de la charge du système sont autant de paramètres fondamentaux dans une approche intelligente pour les applications temps réel. Pour traiter l'antagonisme entre l'IA et le temps réel, nous proposons un modèle d'agent PROGRESS qui permet grâce à un mécanisme de négociation simple d'optimiser l'utilisation des ressources disponibles. Ce mécanisme est hiérarchisé en deux niveaux.

1999 Un environnement de simulation orienté Agents : apport des modèlèles stochastiques et du parallélisme

Maroua Bouzid Vincent Chevrier Stéphane Vialle François Charpillet

Mots-clefs : agents situés, environnement, interaction stochastique, simulation, parallélisme.

Résumé :

2003 Apprentissage par renforcement pour la conception de systèmes multi-agents Réactifs

Alain Dutech Olivier Buffet François Charpillet

Mots-clefs : processus décisionnels de Markov, agents réactifs, apprentissage par renforcement,apprentissage progressif, coordination, coopération

Résumé : Nous proposons une nouvelle méthodologie d’apprentissage par renforcement (AR)pour la conception de systèmes multi-agents réactifs. Bien que le cadre réaliste d’agents situésavec des perceptions locales sorte du cadre théorique de convergence des algorithmes clas-siques d’apprentissage par renforcement, notre méthode permet à chaque agent d’apprendreindividuellement et localement son comportement. L’aspect progressif de notre algorithme quimet les agents en présence de sous-tâches de plus en plus complexes permet de dépasser leslimitations classiques de l’AR dans ce contexte. Notre méthodologie, qui se veut générale, estvalidée en simulation sur un problème où les agents doivent se coordonner pour atteindre unbut global.

2003 Une Architecture Réactive pour la Localisation en Robotique Mobile

Franck Gechter Vincent Chevrier François Charpillet

Mots-clefs : systèmes multi-agents Réactif, Robotique Mobile, Localisation, Suivi.

Résumé : La localisation d’objets est une tâche assez délicate et essentielle dès lors que l’on veut utiliser des robots mobiles. Elle peut être définie comme étant l'action de trouver la position d'un objet, mobile ou fixe, par rapport à un référentiel connu. En alternative aux méthodes classiquement utilisées qui sont généralement issues du traitement du signal, nous proposons une architecture réactive s’appuyant sur des phénomènes physiques d’interaction. Notre objectif est de construire un dispositif de localisation et de suivi d’éléments mobiles, en nombre quelconque, dans un environnement structuré, partiellement connu et de taille non limitée, à partir de d’un nombre variable de capteurs mobiles ou fixes disposés dans l’environnement.

2004 Communication et apprentissage par renforcement pour une équipe d’agents

Daniel Szer François Charpillet

Mots-clefs : apprentissage par renforcement décentralisé, coordination, coopération, communi-cation

Résumé : Nous présentons un nouvel algorithme d’apprentissage par renforcement pour des sys-tèmes multi-agent coopératifs. Le problème de contrôle est formalisé comme un processus dedécision markovien que nous cherchons à résoudre de manière décentralisée. Pour cela, nousproposons une variante du Q-learning avec communication, à savoir un mécanisme de notiﬁ-cation réciproque.Nous allons introduire le problème de coopération multi-agent et poser un critère d’optima-lité pour la solution souhaitée. Nous allons ensuite présenter l’algorithme de notiﬁcation ré-ciproque, prouver sa convergence et étudier des variantes de l’algorithme qui permettent desstratégies de communication plus ﬂexibles. Nous conclurons avec les performances de l’algo-rithme sur un exemple d’apprentissage précis.

2006 programmation dynamique à base de points pour la résolution des DEC-POMDPs

Daniel Szer François Charpillet

Mots-clefs : contrôle optimal décentralisé, DEC-POMDPs, planification

Résumé : Nous présentons un nouvel algorithme de planification pour la construction de systèmes multi-agents réactifs et situés pouvant se modéliser par des processus de décision de Markov décentralisés (DEC-POMDP). Cet algorithme est fondé sur la programmation dyna- mique à base de points. Il est dérivé de techniques de programmation dynamique optimale utilisées pour résoudre des jeux stochastiques partiellement observables(POSG) et des techniques d'approximation utilisées pour résoudre des POMDP mono-agents. Nous montrons pour la première fois qu'il est possible de déterminer un ensemble d'états de croyance multi-agent pertinents, et nous montrons comment ce calcul permet ensuite d'éviter le recours à la program- mation linéaire très couteuse dans le cas multi-agent. Nous détaillons une version exacte et une version approximative de notre algorithme, et nous montrons son efficacité sur un exemple de la littérature.

2007 Méthodes réactives pour le problème de la patrouille, informations propagées vs. dépôt d’informations

Arnaud Glad Hoang Nam Chu Olivier Simonin François Sempé Alexis Drogoul François Charpillet

Mots-clefs : Patrouille multi-agent,systèmes multi-agents réactifs, phéromones digitales.

Résumé : RésuméCet article traite du problème de la patrouillemulti-agent en environnement inconnu selondeux approches collectives exploitant unenvironnement dynamique. Après avoir donnéles critères de performances, nous définissonsun premier algorithme basé uniquement surl'évaporation d'une phéromone déposée parles agents (EVAP), puis nous explicitons lemodèle CLInG proposé dans [10] en 2003 quiintroduit la propagation d'informations surl'oisiveté des régions à visiter. Nousprésentons alors un ensemble de simulationspermettant de comparer les performances deces deux modèles sur des environnements decomplexité croissante. L'analyse est complétéepar une comparaison aux performancesthéoriques optimales, permettant de préciserles topologies pour lesquelles les méthodessont les plus adaptées

2008 Partage d’autorité dans un essaim de drones auto-organisé

François Legras Arnaud Glad Olivier Simonin François Charpillet

Mots-clefs : Partage d’autorité ; robotique collective ; émergence, Auto-organisation ; déploiement de SMA, résistance aux pannes

Résumé : RésuméComme l’attestent de nombreuses études prospectives, les essaims de drones devraientconnaître un développement considérable dansles années à venir. La réalisation de ces nouveaux SMA se heurte cependant à de nombreuxdéfis, en particulier au coût humain dans leurmise en oeuvre, amenant à revoir complètementles interfaces de contrôle actuelles. Nous proposons une approche qui permet à un opérateur unique de faire voler en simulation uneflottille de drones et de réaliser des missionsde surveillance et d’interception. Cet article expose tant les modèles d’auto-organisation développés par l’équipe MAIA autour de la notion de phéromone digitale que les modes opératoires développés par TELECOM Bretagnepour le partage d’autorité. Enfin des résultatsexpérimentaux faisant intervenir des sujets humains montrent l’adéquation de la combinaisondes deux approches pour des missions de surveillance.

2011 Stratégie d’exploration multi-robot fondée sur les champs de potentiels artificiels

Antoine Bautin Olivier Simonin François Charpillet

Mots-clefs : Exploration multi-robot ; Allocation de tâches décentralisée ; Navigation parchamps de potentiels artificiels

Résumé : e contexte de ce travail est le problème de l’exploration multi-robot d’environnements inconnus pour la construction d’une carte métrique.Nous proposons une nouvelle technique de déploiement distribuée, basée sur le choix de lafrontière à explorer (limites entre les zones accessibles et inexplorées) en fonction de la position du robot par rapport à ses voisins. Unchamps de potentiels sans minimum local estcalculé depuis chaque frontière permettant deconnaître en tout point le chemin le plus courtpour s’y rendre. L’exploration consiste à affecter régulièrement à chaque robot une frontièreà atteindre. L’assignation d’une frontière à unrobot est réalisée par un nouvel algorithme utilisant comme critère le nombre de robots plusproches de la frontière considérée. Des mesuresen simulation sont présentées et montrent la validité et l’efficacité de notre approche. Nous évaluons l’efficacité de notre algorithme en comparant, en simulation, ses performances avec lesapproches existantes.

2014 Comparaison de stratégies d’exploration multi-robot classiques et interactives en environnement peuplé

Nassim Kaldé François Charpillet Olivier Simonin

Mots-clefs : Environnement, Coordination,Robotique collective, Interaction, Simulationmulti-agent, Modèles de comportement agent

Résumé : ’exploration multi-robot (EMR) consiste à observer efficacement tous les espaces inconnusd’un environnement. Cette tâche soulève denombreux défis comme l’affectation des tâches,la coordination des robots, la planification desdéplacements et la communication. Nous traitons ici l’exploration en environnement peupléd’humains. Le déplacement et les actions despersonnes rendent ces environnements dynamiques et donc difficiles à explorer. Toutefois,nous proposons d’examiner comment cette présence humaine peut constituer une aide plutôtqu’une gêne. Nous présentons un modèle d’exploration en environnement humain, et définissons un coût d’interaction homme-robot (IHR).Nous en déduisons un cadre formel d’exploration interactive inspiré d’une formalisationclassique d’exploration aux frontières. Enfin,nous évaluons en simulation l’apport de la dimension interactive à l’exploration par frontières.

2019 Exploration et couverture par stigmergie d’un environnement inconnu avec une flotte de robots autonomes réactifs

Nicolas Gauville François Charpillet

Mots-clefs : Multi-robot, stigmergie, exploration

Résumé : RésuméL’exploration autonome d’un environnement inconnu peut être envisagée de différentes manières. On peut notamment citer les approchespar frontières, où des robots sont affectés à deszones inexplorées de la carte. Ces dernières méthodes sont efficaces mais nécessitent de partager une carte, globaliser les décisions d’affectation. Les approches Brick and Mortar, quantà elles, utilisent un marquage au sol avec uneprise de décision locale, mais donnent des performances beaucoup moins intéressantes. L’algorithme présenté ici est un compromis entreces deux approches, permettant une prise de décision locale et, de façon surprenante, des performances proche des approches par frontièresglobales. Nous proposons également une étudecomparative de la performance des trois différentes approches : Brick & Mortar, frontièresglobales et frontières locales. Notre algorithmelocal est également complet pour le problèmed’exploration et peut être facilement distribuésur des robots avec une perte de performancemineure.

LORTA

Nancy, France

INRIA

Sophia Antipolis, France

LORIA

Nancy, France

SUPELEC

LORIA - MAIA

Vandoeuvre les Nancy, France

LORIA

Vandoeuvre-lès-Nancy, France

INRIA

Vandœuvre-lès-Nancy, France

Campus Scientifique BP 239

Vandœuvre-lès-Nancy, France

Université Henri Poincaré

Nancy, France

Université de Lorraine

Vandoeuvre-lès-Nancy, France

Universite de Lorraine

Nancy, France