Posts tagged "apprentissage"

Apprentissage endogène par coopération

La transformation numérique actuelle demande la création d’applications autonomes et adaptables à des environnements ouverts, dynamiques, hétérogènes et imprédictibles. Ainsi, il faut doter ces systèmes de capacités d’apprentissage proactives. Pour cela, les Systèmes Multi-Agents Auto-Adaptatifs permettent de décentraliser le processus d’apprentissage en agentifiant les connaissances. Chaque granule de connaissance est alors autonome et coopère avec ses voisins afin de détecter des incohérences, des faiblesses ou des nouvelles zones à explorer pour perfectionner l’apprentissage. 

L’apprentissage proactif des granules autonomes conduit à créer de nouvelles connaissances par feedback endogène (sans feedback explicite de l’environnement). Les perspectives de ce travail sont de concevoir un mécanisme d’apprentissage adaptatif utilisable pour des applications diverses (robotique, véhicules autonomes, domotique …).

S2P11  S2P11bis  S2P11ter

Agentification et auto-organisation des granules de connaissance (pavés verts et bleus), identification 

des incohérences et insuffisances (pavés rouges et zones blanches), transfert et généralisation

Objectifs scientifiques

Les objectifs de la thèse sont :

 Conception d’un système auto-apprenant

 Apprentissage tout au long de la vie

 Génération d’objectifs et de motivations propres

 Généricité et passage à l’échelle

Contacts

bruno.dato@irit.fr, frederic.migeon@irit.fr, marie-pierre.gleizes@irit.fr

 

Apprentissage par systèmes multi-agents adaptatifs par feedback endogène : Vers des systèmes autodidactes

drone

Nous vivons dans un environnement qui regorge de systèmes artificiels dont le but est de nous assister dans notre quotidien. Toutes ces applications sont développées afin de servir un but précis défini avant leur conception. Cependant, il est impossible de prévoir à l’avance toutes les interactions qu’elles auront avec leur environnement. De plus, ces systèmes sont plongés dans un monde dynamique dans lequel divers dispositifs peuvent apparaître et disparaître. Face à ces besoins, il est légitime de penser que dans un futur proche, nous ne serons plus en mesure de concevoir et programmer tous ces systèmes, ils devront alors apprendre à être utiles de façon autonome et réactive.

Aujourd’hui, pour qu’un système puisse apprendre une tâche ou un service, il a besoin qu’un oracle lui dise ce qu’il est pertinent de retenir, on parle d’apprentissage par démonstrations. Cet apprentissage par démonstrations peut se traduire par une personne qui pilote un robot pour lui montrer une tâche à effectuer. Qu’en est-il si le système se retrouve dans une situation qu’il ne connaît pas ou s’il n’y a personne pour faire cette démonstration ?

Objectifs scientifiques

Ce stage a pour but d’aller au-delà de cet apprentissage par démonstrations et concevoir des méthodes d’auto-apprentissage utilisant seulement les actions et perceptions d’un système afin d’en apprendre un modèle de contrôle. C’est-à-dire de doter un système de capacités d’auto-observation lui permettant d’apprendre quelles conséquences ont ses actions sur ses perceptions sans faire d’hypothèses sur la nature de celles-ci. Ce modèle lui permettra alors d’évoluer dans la représentation qu’il a de son environnement, autrement dit de ses perceptions.

Un autre objectif de ce sujet de recherche est la généricité, les méthodes d’auto-apprentissage devront pouvoir s’appliquer à n’importe quel système doté d’actions et de perceptions. Enfin, le dernier objectif est le passage à l’échelle, cet auto-apprentissage doit pouvoir s’adapter à de grandes quantités d’actions et de perceptions.

Contacts

- Bruno Dato (IRIT) : bruno.dato@irit.fr

- Nicolas Verstaevel (IRIT) : nicolas.verstaevel@irit.fr 

- Marie-Pierre Gleizes (IRIT) : marie-pierre.gleizes@irit.fr 

 

Back to Top