Bruno Dato

Ses 2 Articles :


Mots-clefs : Simulation multi-agent, Apprentissage multi-agent, Évolution, Adaptation
Résumé : tons et évaluons notre solution à base de systèmes multi-agents adaptatifs sur une simulationde contrôle de trajectoire de drone.Le démonstrateur présenté introduit un casd’étude concret d’apprentissage par Systèmesmulti-agent dans un environnent simulé. Le cœurde ce travail est l’enrichissement d’un apprentissage par démonstration à l’aide d’un mécanismed’apprentissage autodidacte. Ce mécanisme permet à l’agent apprenant de dépasser les limitesintroduites par le processus de démonstrationen lui permettant d’adapter son comportementpour faire face à des situations imprévues. Cetapprentissage concerne une tâche robotique :l’apprentissage d’un suivi de trajectoire pourdrone aérien. Le mécanisme d’apprentissage autodidacte apporte de la robustesse à l’apprentissage.

Mots-clefs : Apprentissage par Systèmes multiagent,Apprentissage proactif,Auto apprentissage,Feedbacks endogènes.
Résumé : Dans cet article, nous nous plaçons dans des environnements de Systèmes complexes, imprévisibles et dynamiques pour lesquels nous avons pour objectif de montrer que les systèmes multi-agents adaptatifs sont une solution pertinente à leur apprentissage. Nous utilisons uneapproche d’apprentissage locale inspirée du constructivisme : l’auto-apprentissage de contextes par systèmes multi-agents adaptatifs. Nous cherchons à introduire desrétroactions endogènes comme moyen d’améliorer en interne le processus d’apprentissage en détectant et en résolvant les imprécisions entre les connaissances apprises.Nous proposons pour cela 3 stratégies de résolution desimprécisions d’apprentissage qui sont : une résolution réactive, un apprentissage proactif et un auto-apprentissage.Dans cet article, nous évaluons les performances de l’apprentissage proactif. Nous montrons que l’ajout de rétroactions endogènes facilité par l’auto-observation permetd’accélérer et généraliser l’apprentissage, de choisir intelligemment les données d’apprentissage et d’augmenter lesperformances sur les prédictions.
Université Toulouse III Paul Sabatier
Toulouse, France

Université Toulouse III - Paul Sabatier
Toulouse, France