Posts tagged "apprentissage"

Apprentissage par systèmes multi-agents adaptatifs par feedback endogène : Vers des systèmes autodidactes

drone

Nous vivons dans un environnement qui regorge de systèmes artificiels dont le but est de nous assister dans notre quotidien. Toutes ces applications sont développées afin de servir un but précis défini avant leur conception. Cependant, il est impossible de prévoir à l’avance toutes les interactions qu’elles auront avec leur environnement. De plus, ces systèmes sont plongés dans un monde dynamique dans lequel divers dispositifs peuvent apparaître et disparaître. Face à ces besoins, il est légitime de penser que dans un futur proche, nous ne serons plus en mesure de concevoir et programmer tous ces systèmes, ils devront alors apprendre à être utiles de façon autonome et réactive.

Aujourd’hui, pour qu’un système puisse apprendre une tâche ou un service, il a besoin qu’un oracle lui dise ce qu’il est pertinent de retenir, on parle d’apprentissage par démonstrations. Cet apprentissage par démonstrations peut se traduire par une personne qui pilote un robot pour lui montrer une tâche à effectuer. Qu’en est-il si le système se retrouve dans une situation qu’il ne connaît pas ou s’il n’y a personne pour faire cette démonstration ?

Objectifs scientifiques

Ce stage a pour but d’aller au-delà de cet apprentissage par démonstrations et concevoir des méthodes d’auto-apprentissage utilisant seulement les actions et perceptions d’un système afin d’en apprendre un modèle de contrôle. C’est-à-dire de doter un système de capacités d’auto-observation lui permettant d’apprendre quelles conséquences ont ses actions sur ses perceptions sans faire d’hypothèses sur la nature de celles-ci. Ce modèle lui permettra alors d’évoluer dans la représentation qu’il a de son environnement, autrement dit de ses perceptions.

Un autre objectif de ce sujet de recherche est la généricité, les méthodes d’auto-apprentissage devront pouvoir s’appliquer à n’importe quel système doté d’actions et de perceptions. Enfin, le dernier objectif est le passage à l’échelle, cet auto-apprentissage doit pouvoir s’adapter à de grandes quantités d’actions et de perceptions.

Contacts

- Bruno Dato (IRIT) : bruno.dato@irit.fr

- Nicolas Verstaevel (IRIT) : nicolas.verstaevel@irit.fr 

- Marie-Pierre Gleizes (IRIT) : marie-pierre.gleizes@irit.fr 

 

Back to Top