2020
Architectures multi-agent pour la simulation de Systèmes complexes

Angers
Nombre d'articles : 14
BEN : Une architecture pour des agents cognitifs, affectifs et sociaux dans la simulation
Matthieu Bourgais Patrick Taillandier Laurent Vercouter
Mots-clefs : Simulation sociales,cognition,émotion,personnalité,normes
Résumé : La simulation sociale en tant qu’outil scientifique nécessite le développement de comportements crédibles pourles agents simulant le comportement d’acteurs humains.Une façon d’améliorer la crédibilité des simulations obtenues est d’intégrer des dimensions cognitive, affective etsociales dans la prise de décision des agents. Pour autant,développer des agents avec ces dimensions peut s’avérercompliqué si l’on veut rester accessible à des chercheursqui ne sont pas experts en informatique. L’architectureBEN (Behavior with Emotions and Norms) intègre des dimensions affectives et sociales à une prise de décisions basée sur une architecture BDI pour la réalisation de simulations sociales. Cette architecture modulaire s’appuie surune formalisation des dimensions cognitives, affectives etsociales. BEN est implémenté dans la plateforme de modélisation et de Simulation multi-agent GAMA et est ici illustrée sur un cas d’évacuation d’urgence.

Interactions dans les Communautés Mixtes Humains-Agents : État de l’Art
Julien Saunier Alexandre Pauchet
Mots-clefs : Systèmes multiagents,communautés mixtes,agents virtuels,robots,compagnons artificiels.
Résumé : L’explosion du nombre d’objets connectés, de l’informatique ubiquitaire et des interfaces humain-machine intuitives et naturelles permet une multiplication des Systèmescyber-physiques. Si les interactions avec un seul utilisateur disposent d’une littérature abondante dans le domainedes agents virtuels incarnés, la mise en place de Systèmes coopératifs intégrant plusieurs utilisateurs et plusieurs agents virtuels reste difficile. Les problématiquesclassiques, telles que la gestion des tours de paroles parexemple, doivent être adaptées au contexte multipartie. Denouvelles problématiques, triviales en contexte dyadiquecomme la détection du destinataire d’un énoncé, émergentégalement. Dans cet article, nous discutons les défis actuels posés par les communautés mixtes agents-humainstant au niveau des agents que du systèmes multi-agents dansson ensemble.L’explosion du nombre d’objets connectés et de l’informatique ubiquitaire permet une multiplication des Systèmescyber-physiques dans le contexte de l’Internet des Objets.Cette tendance s’accompagne de la mise à disposition d’interfaces humain-machine intuitives et naturelles dont l’objectif est de permettre aux utilisateurs d’interagir aisément.Nous pouvons par exemple citer Alexa, Siri ou Cortana,qui permettent une interaction en langage naturel [21].De façon à faciliter l’acceptabilité de ces Systèmes et l’engagement des utilisateurs, de nombreux travaux se sont intéressé aux compagnons artificiels, qui regroupent agentsconversationnels animés et robots. Leurs principales applications se situent dans les domaines des environnements pour l’apprentissage humain [2, 46], dans lesquelsles agents peuvent à la fois peupler l’environnement et servir de tuteurs à l’apprenant, les services à la personne [37]et la santé physique ou mentale [11], ou encore le tourisme[45] pour guider les visiteurs et interagir avec eux.Si les interactions entre un utilisateur et un agent virtuelou un robot disposent d’une littérature abondante, la miseen place pratique de Systèmes coopératifs intégrant plusieurs utilisateurs et plusieurs compagnons artificiels restedifficile. Les problématiques classiques, telles que la gestion des tours de paroles par exemple, doivent être adaptées au contexte multipartie. De nouvelles problématiques,triviales en contexte dyadique comme la détection du destinataire d’un énoncé, émergent également.

Micro-Motivations du Second Ordre : application à la ségrégation spatiale
Philippe Collar
Mots-clefs : Sociologie computationnelle,Modèle orienté agent,Motivation de secondordre.
Résumé : Nous nous intéressons au lien entre le microscopique, quiest centré sur les individus et ses interactions avec lesautres, et le macroscopique, qui est centré sur la société[15]. La grande majorité des personnes pensent que leurpropre comportement, s’il était appliqué par tous, auraitdes effets congruents au niveau de la collectivité ; le mérite du modèle de Sakoda-Schelling a été de montrer quecela n’est pas nécessairement le cas [1][2][3][4] ; en effet, dans le contexte spécifique de la ségrégation résidentielle, Schelling a montré via des simulations que mêmeles agents plutôt tolérants finissent par être agrégés spatialement bien au-delà de l’exigence locale de leur niveau detolérance. Ce modèle a été étendu à des seuils de toléranceindividuels, à des réseaux d’influence autres qu’une simplegrille, à des critères de discrimination à plusieurs niveaux,etc. [7][8][10][11].Cet article porte sur l’écart entre les préférences individuels des individus et leurs conséquences au niveau collectif. Le modèle de ségrégation de Sakoda-Schelling estreprésentatif de cette problématique ; un critère de discrimination est utilisé pour décider si une personne "insatisfaite" quittera ou non sa place ; sur la base du ratio depersonnes " acceptables " autour d’un individu, des simulations simples montrent que même les agents tolérants finissent par être agrégés spatialement bien au-delà de l’exigence locale de leur niveau de tolérance. Nous utilisons iciun critère du second ordre pour inciter les individus à quitter leur place. Cet article fournit des éléments de réponseà la question : un tel critère contribue-t-il à réduire l’écartentre les micro-motivations et leur macro-conséquence ?Le terme "second-ordre" est utilisée dans de nombreux domaines comme les Mathématiques, la Technologie, la Psychologie [19], la Philosophie [20], etc. et s’applique à unevariété de concepts. En sociologie computationnelle, NigelGilbert a été le premier à proposer une version du modèlede Schelling où les "propriétés du second ordre" font référence à une rétroaction du niveau macro vers le niveaumicro ; plus précisément, il écrit "l’émergence du secondordre se produit lorsque les agents reconnaissent des phénomènes émergents, tels que des sociétés, des clubs, desorganisations formelles, des institutions, des localités, etainsi de suite, où le fait que vous soyez membre, ou nonmembre, change les règles d’interaction entre vous et lesautres agents" [14]. Le présent article n’adopte pas ce pointde vue où des phénomènes macro émergents influencent leniveau micro ; nous supposons plutôt qu’une décision du

Étude de différentes configurations d’autoconsommation collective de l’énergie à l’échelle du quartier à l’aide de la Simulation multi-agent
J. Albouys Perrois Nicolas Sabouret Yvon Haradji Mathieu Schumann Rodolphe Charrier C. Inar
Mots-clefs : : Simulation multiagent,Simulation,Consommationénergétique,Autoconsommationcollective
Résumé : Cet article présente un modèle de simulation multiagent à deux niveaux d’autoconsommation collective del’énergie. Le premier niveau de ce modèle est uneSimulation multi-agent de l’activité humaine couplée àune simulation thermique du bâtiment qui permetd’obtenir la consommation électrique d’un foyer. Lesecond niveau est une modélisation d’un groupement defoyers pratiquant l’autoconsommation collectived’énergie. Nous présentons une formalisation de cettenotion de groupement ainsi que différentesorganisations pour échanger de l’énergie.Nous étudions ensuite ces différentes organisations etmontrons leur fort impact sur la répartition de l’énergielorsque la production est faible face à la consommation.L’autoconsommation collective (ACC) d’énergieassocie une production d’énergie électrique locale, parexemple avec des panneaux photovoltaïques (PV) ouune éolienne, avec la consommation de toute ou d’unepartie de cette énergie par un ensemble de foyers situésà proximité des moyens de production [7, 8]. L’un desprincipaux intérêts est de maximiser la consommationd’énergie locale et renouvelable sans devoir faire appelà des sources d’énergie centralisées. Complémentaireavec les expérimentations sur site, la simulationnumérique est un outil permettant d’étudier lapertinence technico-économique des nombreusesconfigurations d’ACC possibles et l’évolution desusages de l’énergie dans ces situations. [8].Dans nos précédents travaux [1, 2] nous avions déjà misen avant la nécessité de prendre en compte la diversitéde l’activité des habitants des foyers dans lesproblématiques de l’ACC, en mettant en évidencel’impact positif sur le taux d’autoconsommationcollective, c’est-à-dire la part de la production électriquelocale qui est consommée immédiatement sur place parles foyers. Cependant, les premiers résultats obtenusétaient basés sur une seule configuration d’ACC

Intégration de la Gestion du Contexte et des Dispositifs IoT dans des Maisons Intelligentes basées sur des systèmes multi-agents
Iago Felipe Trentin Fano Ramparany Olivier Boissier
Mots-clefs : Sensibilité au contexte,IoT,Systèmes multiagent,intégration.
Résumé : Avec les technologies IoT, la domotique s’oriente vers la maison intelligente. Les utilisateurs ont ainsi accès à des services à valeur ajoutée offrant un accès intégré aux dispositifs déployés au sein de la maison. Outre le fait que ces applications sont centrées sur l’utilisateur, la coordination décentralisée des décisions et la flexibilité sont des défis importants. L’utilisation d’une approche multi-agent permet de relever ces défis. Cependant, l’intégration d’une telle approche avec les solutions de l’IoT et de la gestion de contexte n’est pas un problème facile. Nous présentons une approche pour cette intégration dans un systèmes multi-agents afin que les agents puissent adapter les services centrés sur l’utilisateur à l’évolution du contexte et des dispositifs déployés. Nous présentons la manière dont nous avons intégré ces technologies dans une architecture multi-agent qui a été conçue pour développer des services à valeur ajoutée qui adaptent leur fonctionnement à l’environnement.

ReCoVac : Décision autonome de reprise de la conduite d’un véhicule autonome et connecté
K. Aguilar Alarcon Marie-Pierre Gleizes Loïc Caroux Elsy Kaddoum Valérie Camps Stéphanie Combettes
Mots-clefs : Véhicule autonome et connecté,reprise de contrôle,Systèmes multiagent
Résumé : véhicules selon leur capacité à assister les conducteurs humains. La société internationale des ingénieurs de l’automobile a ainsi identifié 5 niveaux de conduite autonome.Dans ce travail, nous considérons les véhicules de niveau3 également appelé "l’automatisation conditionnée". Danscertaines situations prédéfinies, comme de longues lignesdroites avec marquage au sol bien visible, le véhicule peutautomatiquement gérer sa trajectoire et sa vitesse, éviter lesobstacles, etc. Le conducteur humain n’est plus obligé degarder les yeux sur la route, mais il doit être capable dereprendre le volant en cas de nécessité.

Un processus pour la sélection de stratégie de gestion de l’information dans les Systèmes de confiance
Nicolas Cointe Amineh Ghorbani Caspar G. Chorus
Mots-clefs : Confiance,autoorganisation,confidentialité.
Résumé : De tels cas de figures peuvent se présenter par exempledans des situations présentant une dimension morale [6]et où des actions, bien qu’exécutables et permises, peuventrendre leurs auteurs désirables ou non au sein d’un collectif. Notons que nous traitons ici de cas où les agents ne disposent d’aucune preuve sur les intentions des autres agentsmais emploient des techniques proposées dans la littérature afin d’évaluer avec une certitude suffisante, les objectifs d’un agent.Sélectionner des partenaires semblant partager des objectifs similaires peut se faire, de manière classique, àl’aide de modèles de confiance [21] afin de laisser le Systèmes s’auto-organiser. L’avantage d’un tel modèle est qu’ilest construit de manière décentralisée, par les agents, ense fondant sur leur expérience individuelle –tirant profitd’observations, connaissances et raisonnement propres àl’agent– et éventuellement sur des expériences transmisespar un Systèmes de réputation [26].Afin de pouvoir raisonner sur les objectifs des autresagents, la littérature propose déjà un ensemble de techniques diverses, que nous regroupons dans cet article ausein du concept plus général de reconnaissance d’objectifs, permettant d’inférer, à partir d’observations, le butle plus vraisemblable compte tenu du comportement d’unagent observé. Les méthodes de reconnaissance d’objectif ont démontré ces deux dernières décennies leur intérêtdans divers domaines applicatifs nécessitant une coopération entre agents autonomes et humains, tels que l’apprentissage de routines comportementales pour la surveillancede personnes âgées à domicile [14], ou bien pour la coopération d’agents autonomes entre eux, par exemple dansle cas d’un groupe de robots devant coordonner leurs déplacements en minimisant les communications [4]. La reconnaissance d’objectifs est également utile dans un cadrecompétitif, afin d’anticiper et éventuellement contrer lesbuts d’un adversaire. Par exemple, leur usage a montré sapertinence pour la détection de comportements humainsdangereux dans une foule [22], ou la déduction de la stratégie employée par un adversaire dans des jeux vidéos [15]ou des compétitions de football robotiques [16].Cependant, tenir compte de l’observation de leur comportement, et de la présence d’un Systèmes de confianceDans certains systèmes multi-agents, en particulier des

Stratégie d’apprentissage proactif endogène par systèmes multi-agents coopératifs
Bruno Dato Marie-Pierre Gleizes Frédéric Migeon
Mots-clefs : Apprentissage par Systèmes multiagent,Apprentissage proactif,Auto apprentissage,Feedbacks endogènes.
Résumé : Dans cet article, nous nous plaçons dans des environnements de Systèmes complexes, imprévisibles et dynamiques pour lesquels nous avons pour objectif de montrer que les systèmes multi-agents adaptatifs sont une solution pertinente à leur apprentissage. Nous utilisons uneapproche d’apprentissage locale inspirée du constructivisme : l’auto-apprentissage de contextes par systèmes multi-agents adaptatifs. Nous cherchons à introduire desrétroactions endogènes comme moyen d’améliorer en interne le processus d’apprentissage en détectant et en résolvant les imprécisions entre les connaissances apprises.Nous proposons pour cela 3 stratégies de résolution desimprécisions d’apprentissage qui sont : une résolution réactive, un apprentissage proactif et un auto-apprentissage.Dans cet article, nous évaluons les performances de l’apprentissage proactif. Nous montrons que l’ajout de rétroactions endogènes facilité par l’auto-observation permetd’accélérer et généraliser l’apprentissage, de choisir intelligemment les données d’apprentissage et d’augmenter lesperformances sur les prédictions.

Analyse des performances d’algorithmes DCOP pour l’association d’utilisateurs de réseaux HetNets
Gauthier Picard Pierre Rust
Mots-clefs : DCOP,HetNet,Allocation de ressources,SINR
Résumé : Cet article étudie l’applicabilité des techniques d’optimisation sous contraintes distribuée (DCOP) dans le cadredes réseaux radios hétérogènes (HetNets). Nous nous intéressons plus particulièrement au problème de l’association des terminaux utilisateurs aux stations de base, dontl’objectif est de déterminer quel utilisateur (e.g. téléphonemobile) est associé à quelle station de base pour créerun canal de communication. Toutes les stations ne garantissent pas les mêmes qualités de service et d’expérienceaux utilisateurs, et la qualité de l’allocation finale (e.g. ledébit total obtenu) est un critère à maximiser. Nous présentons ici un modèle DCOP de ce problème d’association, qui se base sur une agentification des stations de basese coordonnant pour obtenir une allocation efficace. Nousévaluons les performances d’algorithmes légers (MGM,MGM-2, DSA) sur un environnement simulé réaliste. Leursperformances sont comparées à celles d’une solution optimale, ainsi qu’à celle de la politique d’association actuellement utilisée dans ces réseaux, à savoir maxSINR.

Politiques de synchronisation dans les systèmes multi-agents distribués parallèles
Alban Rousset Paul Breugnot Bénédicte Herrmann C. Lang Philippe BENHAMOU
Mots-clefs : multiagent simulation,parallélisme,MAS,High Performance Computing,synchronisation
Résumé : les comportements sont souvent trop élaborés et interdépendants pour pouvoir être modélisés par une loi unique.Les systèmes multi-agents sont alors souvent utilisés pourmodéliser les comportements dynamiques des entités quicomposent le Systèmes car ils reposent sur une descriptionalgorithmique simple d’agents qui interagissent entre eux.De nombreuses plates-formes [13, 7, 12] proposent un environnement de développement pour de tels modèles.La qualité d’une simulation dépend bien souvent de la tailleet de la précision du modèle. Or l’accroissement de la tailledu modèle et de sa précision entraîne, de fait, une augmentation du nombre de calculs réalisés et rend nécessaire lerecours à des exécutions parallèles, voire à l’utilisation demoyens de calcul haute performance (HPC : High Performance Computing). Si la simulation sur un seul ordinateurest souvent complexe, l’exécution distribuée parallèle d’unesimulation est un vrai enjeu car elle pose de nombreuxproblèmes comme la distribution de l’environnement, lacommunication entre les instances parallèles de la plateforme, etc. Il existe des plateformes multi-agent (Paralleland Distributed MAS ou PDMAS) qui prennent en chargetout ou partie de l’exécution distribuée. Plusieurs instances,ou processus, de la plateforme coopèrent pour faciliter lamise en œuvre d’un modèle sur un ensemble d’ordinateursou au sein d’un cluster mais la synchronisation reste l’undes points clefs pour l’exécution efficace d’une simulationmulti-agent parallèle du fait des nombreux échanges etdépendances temporelles qu’elle induit.Nous nous intéressons dans cet article aux problèmes poséspar la synchronisation au sein de simulations multi-agentdistribuées parallèles, en visant plus particulièrement lesexécutions à large échelle. Comme les plates-formes multiagents fonctionnent fréquemment par pas de temps, il estnécessaire de s’interroger sur la manière d’échanger les données entre les processus distribués d’une même simulationau regard de ce mode de fonctionnement.Les contributions proposées dans cet article sont, d’une part,la définition de politiques de synchronisation qui peuventêtre utilisées au sein de simulations multi-agent parallèles

Les meilleurs agents sont ceux qu’on ne simule pas : vers des architectures de simulation multi-paradigmes ?
Sébastien Picault Vianney Sicar
Mots-clefs : Simulation multi-agent,modélisation multiniveaux,interdisciplinarité,épistémologie,parcimonie
Résumé : simulation et proposer un point de vue sur des fronts descience qu’il nous semble indispensable d’explorer dansla prochaine décennie pour conforter la position des SMAen tant que discipline scientifique autonome, pourvoyeusede méthodes fructueuses pour d’autres domaines de recherche. L’idée quelque peu paradoxale que nous défendons ici est qu’une de ces pistes consiste à chercher à nepas simuler d’agents, aussi souvent que possible (et chaquefois que cela est pertinent).Après avoir rappelé brièvement la place qu’occupe désormais la Simulation multi-agent pour l’étude des Systèmescomplexes, nous examinerons deux grandes avancées desdernières années, puis nous expliquerons ce que nous entendons par « ne pas simuler d’agents » et la plus-value decette démarche, avant d’en discuter les difficultés.

Comportements hétérogènes de piétons et comportement émergent d’une foule
Anjara Nobby Rakotoarivelo Jean-Michel Auberlet Roland Brémon
Mots-clefs : Simulation de piétons,modèle mixte,hétérogénéité,évitement de collisions,file d’attente,émergence,stopandgo.
Résumé : arriver dans certaines conditions. La compréhension descomportements émergents de la foule pourrait permettreainsi d’anticiper d’éventuelles catastrophes qui pourraientarriver. Cependant, reproduire ces comportements émergents reste un défi. Parmi ces comportements émergents,le "stop-and-go" est réputé comme le plus méconnu etle plus étudié, que ce soit avec des équations mathématiques [17] ou des méthodes heuristiques [14, 21]. Nousavons opté pour une modélisation microscopique contrairement aux modèles macroscopiques qui considèrent la foulecomme un fluide, et une approche multi-agent, en permettant aux agents d’adapter leurs décisions à leur environnement, conduisant à des comportements observables hétérogènes au sein de la population simulée.Dans cet article, nous proposons de simuler une foule unidirectionnelle composée de piétons aux comportements hétérogènes, et se déplaçant dans un couloir. Sous certainesconditions, nous montrons que les piétons adaptent leursinteractions avec leurs voisins, ce qui fait émerger un comportement de foule particulier : le phénomène de stop-andgo, phénomène très connu en trafic routier. Pour cela, nousavons utilisé un modèle à base d’agents pour la simulation de piétons, appelé ORCA (Optimal Reciprocal Collision Avoidance), et un modèle de file d’attente. Comme laplupart des modèles de simulation piétons, les agents dumodèle ORCA utilisent tous le même raisonnement pour sedéplacer, raisonnement qui repose sur le concept d’évitement de collisions. Nous avons modifié le modèle ORCAen introduisant un autre comportement de déplacement,le suivi, permettant ainsi de produire des comportementshétérogènes. En effet, un piéton peut avoir plusieurs objectifs dans son déplacement, éviter les autres, rester engroupe mais également en fonction du contexte suivre quelqu’un. Nous nous sommes concentrés sur les comportements d’évitement et de suivi. Dans certaines situations,un piéton détermine ses déplacements en fonction de sesvoisins mais également par rapport à celui du piéton quile précède. Ainsi nous avons testé plusieurs combinaisonsentre comportements d’évitement et de comportements desuivi. Nous avons vérifié que nos modèles sont cohérentsavec les propriétés d’une foule en utilisant le diagrammefondamental qui décrit la relation entre la densité et la vitesse moyenne d’un flux. Nos données ont été comparéesentre elles, mais aussi avec des travaux antérieurs. L’un

Apprentissage adaptatif de comportements éthiques
Rémy Chaput Olivier Boissier Mathieu Guillermin Salima Hassas
Mots-clefs : Éthique,Apprentissage par renforcement,Systèmes MultiAgent,Répartition de l’énergie.
Résumé : L’utilisation croissante d’algorithmes d’Intelligence Artificielle (IA) dans des applications impactant des humains requiert de doter ces Systèmes d’un comportement pouvant être jugé éthique selon des valeurs humaines. Bien que plusieurs approches existent, la question de l’adaptation au contexte, aux préférences et principes éthiques des utilisateurs, reste posée. Nous proposons de traiter cette question par l’Apprentissage par Renforcement Multi-Agent de tels comportements dans des situations différentes. Nous utilisons des tables de Q-Valeurs et des Cartes AutoOrganisatrices Dynamiques pour permettre l’apprentissage adaptatif de la représentation de l’état de l’environnement, ainsi que des fonctions de récompense pour guider l’éthique du comportement. Cette proposition est évaluée sur un simulateur de répartition d’énergie dans des Smart Grids que nous avons développé. Plusieurs fonctions de récompense visant à déclencher des comportements éthiques sont évaluées. Les résultats montrent la capacité de s’adapter à différentes conditions. En sus des contributions sur le plan de l’adaptation éthique, nous comparons notre modèle à d’autres approches d’apprentissage et montrons de meilleures performances par rapport à une approche d’Apprentissage Profond basée sur le modèle Actor-Critic.

Émergence de comportements collectifs basée sur l’apprentissage progressif individuel
François Suro Jacques Ferber Tiberiu Stratulat Michel Occello
Mots-clefs : Robotique développementale, Apprentissage agent, Architecture modulaire, Architecture hiérarchique, Apprentissage par Curriculum, Coordination multi-agent
Résumé : Dans la perspective d’un développement ouvert et continu il est crucial qu’un comportement final souhaité à un instant donné puisse être un élément pour la création future de comportements plus complexes, dont le but ne peut être anticipé. L’acquisition de nouveaux comportements est déclenchée par l’apparition de nouveaux besoins et problèmes résultants de l’interaction avec l’environnement,mais aussi à travers l’interaction avec d’autres agents. Dans cet article nous soumettons l’architecture développementale MIND à un problème de coordination multiagents. A partir de comportements établis individuellement, nous ferons apprendre à un groupe d’agents, au moyen d’un curriculum établi par un instructeur humain,un comportement collectif, ainsi que l’utilisation alternante de comportements individuels et collectifs afin d’accomplir un but commun