François Charpillet

Ses 11 Articles :


Mots-clefs :
Résumé : Les techniques d'Intelligence Artificielle constituent une approche intéressante pour automatiser des applications comme le contrôle de processus, l'assistance médicale ou la robotiue. La plupart de ces applications sont de nature temps réel. Alors que le temps réel nécessite des opérations continues et prédictibles, les techniques issues de l'Intelligence Artificielle mettent en oeuvre des algorithmes coûteux en temps, avec des performances imprévisibles et fortement variables. Mais si la vitesse d'exécution est bien évidemment un paramètre essentiel dans la conception de systèmes temps réel, ce n'est pas le seul. Comme indiqué dans [DOD 891, la capacité d'un système à respecter ses dates limites d'exécution, sa réactivité face aux événements nouveaux qui se produisent, sa capacité à réévaluer les priorités en fonction de la charge du système sont autant de paramètres fondamentaux dans une approche intelligente pour les applications temps réel. Pour traiter l'antagonisme entre l'IA et le temps réel, nous proposons un modèle d'agent PROGRESS qui permet grâce à un mécanisme de négociation simple d'optimiser l'utilisation des ressources disponibles. Ce mécanisme est hiérarchisé en deux niveaux.

Mots-clefs : agents situés, environnement, interaction stochastique, simulation, parallélisme.
Résumé :

Mots-clefs : processus décisionnels de Markov, agents réactifs, apprentissage par renforcement,apprentissage progressif, coordination, coopération
Résumé : Nous proposons une nouvelle méthodologie d’apprentissage par renforcement (AR)pour la conception de systèmes multi-agents réactifs. Bien que le cadre réaliste d’agents situésavec des perceptions locales sorte du cadre théorique de convergence des algorithmes clas-siques d’apprentissage par renforcement, notre méthode permet à chaque agent d’apprendreindividuellement et localement son comportement. L’aspect progressif de notre algorithme quimet les agents en présence de sous-tâches de plus en plus complexes permet de dépasser leslimitations classiques de l’AR dans ce contexte. Notre méthodologie, qui se veut générale, estvalidée en simulation sur un problème où les agents doivent se coordonner pour atteindre unbut global.

Mots-clefs : systèmes multi-agents Réactif, Robotique Mobile, Localisation, Suivi.
Résumé : La localisation d’objets est une tâche assez délicate et essentielle dès lors que l’on veut utiliser des robots mobiles. Elle peut être définie comme étant l'action de trouver la position d'un objet, mobile ou fixe, par rapport à un référentiel connu. En alternative aux méthodes classiquement utilisées qui sont généralement issues du traitement du signal, nous proposons une architecture réactive s’appuyant sur des phénomènes physiques d’interaction. Notre objectif est de construire un dispositif de localisation et de suivi d’éléments mobiles, en nombre quelconque, dans un environnement structuré, partiellement connu et de taille non limitée, à partir de d’un nombre variable de capteurs mobiles ou fixes disposés dans l’environnement.

Mots-clefs : apprentissage par renforcement décentralisé, coordination, coopération, communi-cation
Résumé : Nous présentons un nouvel algorithme d’apprentissage par renforcement pour des sys-tèmes multi-agent coopératifs. Le problème de contrôle est formalisé comme un processus dedécision markovien que nous cherchons à résoudre de manière décentralisée. Pour cela, nousproposons une variante du Q-learning avec communication, à savoir un mécanisme de notifi-cation réciproque.Nous allons introduire le problème de coopération multi-agent et poser un critère d’optima-lité pour la solution souhaitée. Nous allons ensuite présenter l’algorithme de notification ré-ciproque, prouver sa convergence et étudier des variantes de l’algorithme qui permettent desstratégies de communication plus flexibles. Nous conclurons avec les performances de l’algo-rithme sur un exemple d’apprentissage précis.

Mots-clefs : contrôle optimal décentralisé, DEC-POMDPs, planification
Résumé : Nous présentons un nouvel algorithme de planification pour la construction de systèmes multi-agents réactifs et situés pouvant se modéliser par des processus de décision de Markov décentralisés (DEC-POMDP). Cet algorithme est fondé sur la programmation dyna- mique à base de points. Il est dérivé de techniques de programmation dynamique optimale utilisées pour résoudre des jeux stochastiques partiellement observables(POSG) et des techniques d'approximation utilisées pour résoudre des POMDP mono-agents. Nous montrons pour la première fois qu'il est possible de déterminer un ensemble d'états de croyance multi-agent pertinents, et nous montrons comment ce calcul permet ensuite d'éviter le recours à la program- mation linéaire très couteuse dans le cas multi-agent. Nous détaillons une version exacte et une version approximative de notre algorithme, et nous montrons son efficacité sur un exemple de la littérature.

Mots-clefs : Patrouille multi-agent,systèmes multi-agents réactifs, phéromones digitales.
Résumé : RésuméCet article traite du problème de la patrouillemulti-agent en environnement inconnu selondeux approches collectives exploitant unenvironnement dynamique. Après avoir donnéles critères de performances, nous définissonsun premier algorithme basé uniquement surl'évaporation d'une phéromone déposée parles agents (EVAP), puis nous explicitons lemodèle CLInG proposé dans [10] en 2003 quiintroduit la propagation d'informations surl'oisiveté des régions à visiter. Nousprésentons alors un ensemble de simulationspermettant de comparer les performances deces deux modèles sur des environnements decomplexité croissante. L'analyse est complétéepar une comparaison aux performancesthéoriques optimales, permettant de préciserles topologies pour lesquelles les méthodessont les plus adaptées

Mots-clefs : Partage d’autorité ; robotique collective ; émergence, Auto-organisation ; déploiement de SMA, résistance aux pannes
Résumé : RésuméComme l’attestent de nombreuses études prospectives, les essaims de drones devraientconnaître un développement considérable dansles années à venir. La réalisation de ces nouveaux SMA se heurte cependant à de nombreuxdéfis, en particulier au coût humain dans leurmise en oeuvre, amenant à revoir complètementles interfaces de contrôle actuelles. Nous proposons une approche qui permet à un opérateur unique de faire voler en simulation uneflottille de drones et de réaliser des missionsde surveillance et d’interception. Cet article expose tant les modèles d’auto-organisation développés par l’équipe MAIA autour de la notion de phéromone digitale que les modes opératoires développés par TELECOM Bretagnepour le partage d’autorité. Enfin des résultatsexpérimentaux faisant intervenir des sujets humains montrent l’adéquation de la combinaisondes deux approches pour des missions de surveillance.

Mots-clefs : Exploration multi-robot ; Allocation de tâches décentralisée ; Navigation parchamps de potentiels artificiels
Résumé : e contexte de ce travail est le problème de l’exploration multi-robot d’environnements inconnus pour la construction d’une carte métrique.Nous proposons une nouvelle technique de déploiement distribuée, basée sur le choix de lafrontière à explorer (limites entre les zones accessibles et inexplorées) en fonction de la position du robot par rapport à ses voisins. Unchamps de potentiels sans minimum local estcalculé depuis chaque frontière permettant deconnaître en tout point le chemin le plus courtpour s’y rendre. L’exploration consiste à affecter régulièrement à chaque robot une frontièreà atteindre. L’assignation d’une frontière à unrobot est réalisée par un nouvel algorithme utilisant comme critère le nombre de robots plusproches de la frontière considérée. Des mesuresen simulation sont présentées et montrent la validité et l’efficacité de notre approche. Nous évaluons l’efficacité de notre algorithme en comparant, en simulation, ses performances avec lesapproches existantes.

Mots-clefs : Environnement, Coordination,Robotique collective, Interaction, Simulationmulti-agent, Modèles de comportement agent
Résumé : ’exploration multi-robot (EMR) consiste à observer efficacement tous les espaces inconnusd’un environnement. Cette tâche soulève denombreux défis comme l’affectation des tâches,la coordination des robots, la planification desdéplacements et la communication. Nous traitons ici l’exploration en environnement peupléd’humains. Le déplacement et les actions despersonnes rendent ces environnements dynamiques et donc difficiles à explorer. Toutefois,nous proposons d’examiner comment cette présence humaine peut constituer une aide plutôtqu’une gêne. Nous présentons un modèle d’exploration en environnement humain, et définissons un coût d’interaction homme-robot (IHR).Nous en déduisons un cadre formel d’exploration interactive inspiré d’une formalisationclassique d’exploration aux frontières. Enfin,nous évaluons en simulation l’apport de la dimension interactive à l’exploration par frontières.

Mots-clefs : Multi-robot, stigmergie, exploration
Résumé : RésuméL’exploration autonome d’un environnement inconnu peut être envisagée de différentes manières. On peut notamment citer les approchespar frontières, où des robots sont affectés à deszones inexplorées de la carte. Ces dernières méthodes sont efficaces mais nécessitent de partager une carte, globaliser les décisions d’affectation. Les approches Brick and Mortar, quantà elles, utilisent un marquage au sol avec uneprise de décision locale, mais donnent des performances beaucoup moins intéressantes. L’algorithme présenté ici est un compromis entreces deux approches, permettant une prise de décision locale et, de façon surprenante, des performances proche des approches par frontièresglobales. Nous proposons également une étudecomparative de la performance des trois différentes approches : Brick & Mortar, frontièresglobales et frontières locales. Notre algorithmelocal est également complet pour le problèmed’exploration et peut être facilement distribuésur des robots avec une perte de performancemineure.