Behavior Regulation

Description du projet

Le but de ce projet est d'utiliser un réseau de régulation génétique pour aggréger des comportements haut-niveaux génériques dans une architecture modulaire. Dans le cadre d'une étude réalisée en collaboration avec EADS IW, cette architecture est utilisée pour des missions de protections d'une base par un système multi-robots contre des ennemis arrivant de part et d'autre de l'environnement. Pour cela, le GRN doit réguler intelligemment des comportements haut niveaux tels que la défense, l'interception, etc. Chaque comportement calcule une direction permettant de réaliser l'action qui lui est assigné (par apprentissage ou à l'aide d'un script). Le GRN doit ensuite pondérer ces déplacements pour donner le comportement global du robot. Pour ce faire, il possède un certain nombre d'entrées permettant de localiser l'ennemi, de déterminer sa place dans l'escadron et sa position par rapport à la base. Pour valider cette approche, plusieurs expériences ont été menées.

Expérience 1 : face à l'incertitude

Cette architecture modulaire régulée par un GRN a d'abord été testé avec de l'incertitude dans le cadre d'un robot ayant à intercepter une cible. Dans ce problème, la position de la cible n'est pas connue mais une demande de relocalisation (très coûteuse) peut être demandée afin de mettre à jour cette position. Le GRN est ici utilisé pour moduler le comportement de défense et d'attaque du défenseur ainsi que les demandes de relocalisation. Il est optimisé pour minimiser le nombre de relocalisation tout en assurant un maximum d'interceptions. Cette architecture a été testé avec des attaquants ayant des vitesses de déplacement supérieurs aux robots défenseur. Le GRN s'est montré plus souple qu'un script développé par des experts, permettant de défendre contre des ennemis plus rapides que lui. La vidéo ci-dessous présente les résultats de cette expérience en un contre un et en équipe.

1 contre 1 avec incertitude

Interception en équipe avec incertitude

Expérience 2 : interception en équipe

Dans cette expérience, le GRN doit intercepter une séquence d'attaquants arrivant de part et d'autres de l'environnement. Pour ce faire, le GRN doit moduler quatres comportements : la défense, l'attaque, le regroupement et la dispersion. Après plusieurs optimisations indépendantes par un algorithme génétique, un certain nombre de formations emerge. Les vidéos ci-dessous en présente quatre d'entre elles.

Formation 1 : l'aile

Formation 2 : la ligne

Formation 3 : répartition dans l'espace

Formation 4 : équipe minimale

Expérience 3 : attaques simultanées

Dans cette expérience, l'architecture doit faire face à une séquence de plusieurs attaquants arrivant en même temps sur la base. Pour résoudre ce problème, une hiérarchisation a été imaginée. Elle permet à un controleur globale (GRN ou script) de répartir les unités de défense en équipe. Un GRN développé précédemment (naturellement adaptatif quant à la taille de l'équipe) pilote ensuite chaque robot de l'équipe en créant la formation nécessaire pour mener à bien la mission de l'équipe. Un GRN et un script ont été développer pour gérer la répartition des robots en équipe. Les vidéos ci-dessous présentent les résultats avec les deux techniques. Le script développé est pour le moment plus robuste que le GRN car peu d'entrainement ont été effectués pour cette dernière approche mais les résultats sont encourageants.

Répartition des robots en équipe par un GRN

Répartition des robots en équipe par un script

Personnes impliquées dans ce projet

Martin Delecluse (Etudiant ISAE)

Sylvain Cussat-Blanc (Université Toulouse 1 Capitole - IRIT)

Stéphane Sanchez (Université Toulouse 1 Capitole - IRIT)

Nicolas Schneider (EADS Innovation Work)

Références

Martin Delecluse. Autonomous and Robust Control Architecture for Multi-Robot System. Rapport de stage ingénieur, Septembre 2013. PDF retour