Partenaires



Rechercher



Accueil du site > Français > Thèmes de recherche > Thème 3 - Interaction, autonomie, dialogue et coopération > Equipe SMAC > Site SMAC > Projets, outils et applications > Projets > Projets terminés > microMéga

microMéga

Modélisation des dynamiques microbiennes par systèmes multi-agents adaptatifs intégrant les données macroscopiques et moléculaires

Projet labellisé par l’ ANR (Agence Nationale de la Recherche) - No BLAN-0202-05

 

Dates : 05/12/2005 - 05/12/2008
Financement : ANR (Agence Nationale de la Recherche)
Partenaires :
  • LBB (Laboratoire de Biotechnologies-Bioprocédés devenu le Laboratoire d’Ingénierie des Systèmes Biologiques et des Procédés ou LISBP), INSA Toulouse
  • IRIT (Institut de recherche en Informatique de Toulouse), UPS-Université de Toulouse III, équipe SMAC
  • LAAS (Laboratoire d’Analyse et d’Architecture des Systèmes), équipe DISCO
  • LSP (Laboratoire de Statistique et Probabilités), UPS-Université de Toulouse III
Responsable : Jean-Louis Uribelarrea, LBB-INSA
Contact pour l’IRIT : Carole Bernon
Wiki : Accès restreint aux membres du projet (ici)
Livrables : Accès restreint (ici)

 

Objectifs du projet
La plate-forme de modélisation
Documentation associée
Bibliographie
Références

 

GIF - 9.2 ko
Logo microMega

Objectifs du projet de recherche

Contexte de l’étude

Dans les tentatives de description du comportement des systèmes vivants, quand la modélisation déductive n’a pas abouti, la démarche par le raisonnement qualitatif basé sur la fonction des molécules a montré ses limites. Si l’on sait, par homologie, attribuer des propriétés à un élément d’un système vivant à partir de sa structure, il semble actuellement impossible de les déduire qualitativement ou quantitativement. De la même manière, si les propriétés sont connues, on ne peut clairement en déduire leur fonction dans la cellule vivante et, à partir des caractéristiques des cellules vivantes, calculer leur comportement dans un environnement déterminé. En général, cette démarche déductive de description comportementale échoue du fait que la fonction d’un élément constitutif du système vivant dépend du fonctionnement simultané des autres éléments. Le problème récurrent est que, par le calcul ou autrement, les propriétés fonctionnelles de la cellule ne peuvent être déduites des propriétés de ses seuls composants.

Dans ce contexte, avec leur capacité à décrire la complexité, les outils mathématiques offrent une perspective d’analyse des éléments structurels du monde vivant afin de proposer des fonctionnalités prenant en compte leurs interactions dynamiques itératives fortement non linéaires. Toutefois, cette démarche ne peut s’affranchir de la réalité biologique et se doit donc d’associer intimement les disciplines biologiques et mathématiques.

Diverses approches sont actuellement développées pour décrire le comportement de la cellule :

  • la « cellule virtuelle » regroupe un ensemble de logiciels permettant de décrire l’organisation métabolique d’un organisme, d’estimer la distribution de la matière dans son fonctionnement et d’extrapoler ses potentialités de production [ Loew01 ] ;
  • l’« E-cell » permet de quantifier l’activité cellulaire à partir de cinétiques parfaitement caractérisées exprérimentalement sur le plan catalytique et quantitatif [ Tomita00, Tomita01 ] ;
  • la description principalement cinétique qui oblitère l’analyse des mécanismes réels ou possibles pouvant être mis en jeu [ Nissen97, Vanrolleghem98 ].

Objectif du projet

La démarche adoptée dans ce projet consiste à rechercher une description d’une cellule vivante (ou d’une partie) basée sur des mécanismes et des valeurs paramètriques expérimentalement déterminés.

La complexité de la réponse biologique est liée à la transmission de l’information portée par le transcriptome jusqu’au comportement physiologique. Elle sous-entend le métabolome, le fluxome mais également les différents mécanismes de régulation : feedback, régulation génomique, régulation énergétique, homéostasie cellulaire... La technique des puces à ADN permet d’étudier le transcriptome d’une cellule sous diverses conditions générant ainsi une masse considérable d’informations, concernant l’expression des gènes de cette cellule, qui devront être analysées et interprétées. D’autre part, de nombreuses données macroscopiques (de type biologique et physique) issues d’expérimentations sont disponibles ou réalisables.

Cette approche doit donc intégrer :

  • la conception des expérimentations susceptibles de produire les informations quantitatives et qualitatives sur le comportement macroscopique du modèle biologique choisi et sa réponse en terme de génomique fonctionnelle ;
  • une analyse statistique adaptée au volume considérable des données transcriptomiques et biologiques produites afin d’en extraire les composantes les plus pertinentes et aptes à la modélisation ;
  • la modélisation logicielle ondée sur la technologie des systèmes multi-agents adaptatifs puisqu’ils sont une réponse adéquate à la résolution de problèmes complexes.

La levure Saccharomyces Cerevisiae a été choisi comme modèle biologique représentatif de la complexité de la réponse de la cellule eucaryote à cause de la disponibilité des outils technologiques, tant sur le plan de l’analyse comportementale macroscopique que de la disponibilité des données génomiques.

Les objectifs cibles du projet microMéga sont multiples :

  • Montrer les faisabilité d’une démarche itérative observation-modélisation-simulation prédictive pouvant aider à la conception expérimentale dans le domaine de l’interprétation de l’analyse transcriptomique. En référence à des réponses phénotypiques et macroscopiques pouvant être obtenues par des effecteurs ou des sollicitations environnementales variés, après une phase d’apprentissage, il devrait être possible de confronter les réponses simulées et concrètes pour des configurations nouvelles (effets croisés, nouveaux effecteurs...).
  • Guider l’étude sur les principaux mécanismes assurant le maintien de l’activité et l’intégrité cellulaire, à savoir la flexibilité du métabolisme énergétique et les réponses aux modifications physico-chimiques de l’environnement. Il paraît possible de pouvoir prédire une réponse transcriptomique basale qui, prise comme référentiel, permettrait de dégager, de l’information globale, les données pertinentes à l’occasion d’études centrées sur des problématiques biologiques plus spécifiques.
  • Extraite, à partir des signaux quantitatifs (réponse transcriptomique et réponse transcriptionnelle), des informations qualitatives qui permettront de construire une représentation comportementale identifiante de ces mécanismes pouvant être intégrés comme entrants du système d’apprentissage.
  • Améliorer les théories des systèmes complexes adaptatifs par l’expérimentation dans un domaine subtil qu’est celui de la biologie. De tels systèmes sont composés d’un grand nombre d’entités autonomes dont le comportement collectif permet d’obtenir, par émergence, la fonction souhaitée.

L’objectif de notre étude est de réconcilier ces données métaboliques, phénotypiques et génomiques afin de construire un système dont les composantes vont apprendre à interagir comme s’il s’agissait d’un système vivant. À partir des données observables, le système artificiel doit parvenir à prédire l’expression génomique de la levure cible en déterminant l’organisation individuelle et collective de ses constituants afin de tendre vers ces données observables. Une fois l’organisme virtuel modélisé, il pourra prédire des données transcriptomiques simulées à partir de nouvelles données macroscopiques, ce qui permettrait de réaliser de nouvelles expériences biologiques simulées sans avoir recours à de réelles puces à ADN, technique onéreuse.

Apport scientifique de microMéga

Sur le plan informatique, le défi est d’obtenir un traitement capable d’intégrer deux bases de données quantitativement très différentes (6000 gènes et quelques dizaines de données macro-cinétiques) en adaptant, interactivement avec l’étape statistique, l’extraction de connaissances pour conserver toute la complexité.

Le type d’algorithme retenu pour ce projet permet d’aborder la problématique de la simulation cellulaire sans avoir à mettre en oeuvre une capacité de calcul aussi élevée que celle exigée par d’autres approches.

 

La plate-forme de modélisation

L’objectif premier du projet microMéga pour l’équipe SMAC a été de confronter la théorie des AMAS (Adaptive Multi-Agent Systems) à un nouveau domaine, celui de la biologie computationnelle.

L’objectif à long terme de microMéga est de permettre aux biologistes de réaliser des expérimentations virtuelles. Cela signifie leur fournir les moyens de construire un modèle intracellulaire assez flexible pour permettre la compréhension de phénomènes cellulaires simulés et la découverte de nouvelles expérimentations. La plupart des modèles utilisés pour simuler des phénomènes biologiques, qu’ils reposent sur des modèles mathématiques, des réseaux de neurones, des réseaux de Petri ou autres, agissent souvent comme des boîtes noires en empêchant de comprendre la structure réelle du système simulé et sont essentiellement statiques. Par exemple, il est généralement impossible d’ajouter de nouveaux éléments au modèle en cours de fonctionnement ou de le faire évoluer dans un environnement dynamique.

Vers l’auto-construction de modèles

L’idée du travail entrepris dans ce projet est de faire en sorte que le modèle reflète à tout instant les données expérimentales ainsi que les souhaits de l’utilisateur i.e. qu’il reste fonctionnel quels que soient les changements apportés à son environnement d’exécution. On doit alors le doter de capacités à s’adapter à ces changements et donc à s’auto-construire en fonction notamment des données expérimentales sur lesquelles il va "apprendre" à devenir le modèle adéquat.

Une fois ce modèle considéré comme stable et donnant les bons résultats pour ces données expérimentales, il doit être possible de déconnecter cette capacité d’auto-construction. On peut alors utiliser le modèle pour réaliser des simulations à partir de données différentes de celles qui lui ont permis "d’apprendre" sa structure.

L’approche adoptée dans microMéga est une approche ascendante qui consiste à identifier les composants de base du modèle et à les laisser interagir de façon à trouver une bonne organisation, celle qui conduit au modèle fonctionnel attendu. Le modèle est implanté sous la forme d’un système multi-agent auto-organisateur et adaptatif dans lequel les composants précédemment identifiés ont été "agentifiés".

Le système multi-agent

Les données expérimentales sont généralement incomplètes et hétérogènes et les réactions intracellulaires sont complexes et imparfaitement connues. L’architecture de la plate-forme doit être stable et assez souple pour supporter des remises en cause éventuelles. C’est pourquoi, les composants ont été identifiés au sein des éléments de base du réseau d’interactions locales de la cellule, à savoir les gènes, les protéines, les métabolites intracellulaires, les sucres de réserve et la respiration. Au final, différents types d’agents - dits fonctionnels - ont été identifiés :

  • des agents représentant les éléments chimiques de base de la cellule, une quantité leur est associée ;
  • des agents représentant les réactions chimiques pouvant se produire au sein de la cellule. Ces agents sont de quatre types :
    • les transporteurs qui déplacent une quantité d’un élément d’un compartiment à l’autre, ce transport peut être actif (consommant de l’ATP) ou passif ;
    • les catalyseurs qui transforment une quantité d’un élément en deux autres, cette catalyse peut être éventuellement régulée ;
    • les synthétiseurs qui effectuent la transformation inverse d’un catalyseur en assemblant deux éléments pour en produire un, une régulation est aussi possible ;
    • les gènes qui doivent corroborer les données sur les transcrits et qui sont vus comme des réactions particulières. En combinant ces différents agents dans un réseau d’interactions, il devient possible de construire des réactions plus complexes.

Il est aussi nécessaire de pouvoir interagir avec la plate-forme dans le but d’observer ou d’interpréter le modèle en fonctionnement, ou bien d’intégrer les données expérimentales sur lesquelles le modèle qui se construit va apprendre. Enfin, il est intéressant d’avoir un moyen d’influencer la structure du modèle en cours de construction, de le contraindre sur certains aspects qui sont biologiquement connus et qu’il est inutile de redécouvrir. Par exemple, le nombre de compartiments cellulaire est a priori connu et agir sur le modèle pour lui faire respecter cette contrainte est utile. Un type d’agents supplémentaire, agents qui n’existent que pour exercer une pression sur le modèle ou bien l’observer, a donc été identifié, il s’agit des agents "vues".

Tous ces agents sont des agents coopératifs au sens de la théorie des AMAS.

Un modèle d’agent coopératif a été proposé pour les besoins du projet en dissociant le comportement "nominal" d’un agent (fonctionnalité de base) de son comportement "coopératif (ou adaptatif)". Ce dernier comportement permet à un agent de faire face à des situations qui sont néfastes pour l’attitude coopérative qu’il doit exhiber envers son environnement (situations non coopératives). Ce comportement coopératif consiste à :

  • tenter de résorber ces situations néfastes en essayant d’abord d’ajuster ses paramètres de fonctionnement (comportement de réglage) ;
  • essayer de reconsidérer ses liens avec les autres, si le comportement de réglage ne suffit pas à résoudre le problème (comportement de réorganisation) ;
  • provoquer la création d’autres agents ou bien à reconsidérer sa place au sein du système en disparaissant si un agent se juge complètement inutile (comportement d’évolution).

Les comportements des agents fonctionnels et des agents vues ont donc été implantés selon ce modèle.

La plate-forme est opérationnelle, elle permet de construire des modèles manuellement ou automatiquement, même si, pour l’instant,les modèles ainsi conçus ne s’auto-adaptent pas dans leur intégralité. Elle permet aussi d’agir en temsp réel sur le modèle construit, d’effectuer des simulations et de visualiser leurs résultats au cours du temps.

Un exemple de résultat

GIF - 10.9 ko
Réseau microMéga correspondant à un modèle de photosynthèse/respiration.

Le réseau figuré ici représente un modèle simulant les mécanismes de respiration et de photosynthèse des végétaux. Il ne s’agit pas d’une modélisation biologique fidèle de ce phénomène complexe, mais plutôt d’une image pertinente de sa dynamique.

Les carrés bleus représentent des agents-éléments, les étoiles vertes sont des réactions de synthèse et les octogones sont des réactions de catalyse. Ces réactions consomment et produisent des éléments (liens pleins) et peuvent être régulées (liens pointillés) par un ou des éléments.

Les réactions présentes dans cette simulation, la photosynthèse, d’une part, et la respiration, d’autre part, sont elles-mêmes décomposées en deux "sous-réactions" formant l’ensemble décrit par cette table :

Réactions Consommés Produits
Photosynthesis_S1 CO2 + Lumière Photosynthesis_E1
Photosynthesis_S2 Photosynthesis_E1 + Sels Biomasse
Respiration_S1 Biomasse + O2 Respiration_E1
Respiration_C1 Respiration_E1 Chaleur + CO2

La Lumière est l’élément central de cette simulation, sa présence permettant la transition entre les réactions de respiration et de photosynthèse, réactions ne pouvant avoir lieu simultanément. De ce fait, la simulation considère initialement la lumière allumée (modélisée par une valeur fixe arbitrairement haute), et l’éteint (valeur nulle) à t=90 afin d’observer la réaction du système. Notons que les quantités initiales des différents éléments apparaissant dans cette simulation ont été déterminées empiriquement.

Les résultats du déroulement de l’intégralité de la simulation sont visibles ci-dessous. Lorsque la lumière est présente, nous observons une forte augmentation de la quantité de biomasse, ainsi qu’une diminution de la quantité de CO2. Ces indicateurs mettent en évidence le déroulement des réactions de photosynthèse.

GIF - 28.6 ko
Résultats de la simulation de la photosynthèse/respiration

A partir de t=90, la quantité de lumière est réduite jusqu’à son extinction. Les conséquences de cette action sont d’une part, la stabilisation, puis la diminution de la biomasse, et d’autre part, l’augmentation de la quantité de C02 du système. Ainsi, nous observons les signes de la présence des réactions de respiration. Les effets correspondant au déroulement de la photosynthèse n’apparaissant plus dans les résultats, nous constatons que le système s’est adapté aux différents éléments présents afin de produire la réaction appropriée.

 

Documentation associée

Sont disponibles :

  • un rapport de recherche présentant l’état de l’art du domaine ainsi que les objectifs et avancées du projet (voir bibliographie ci-dessous) ;
  • la version courante de la plate-forme (mise à jour le 05/05/09) :
    • Pour un environnement Windows (32 ou 64 bits) (zip, 9,8 Mo) ;
    • Pour un environnement Linux 32 bits (zip, 12,4 Mo) ;
    • Pour un environnement Linux 64 bits (zip, 12,5 Mo).
  • le manuel d’utilisation (pdf) de la plate-forme. Ce manuel inclut des informations relatives à l’installation ;
  • le dossier de conception (pdf) de la plate-forme.

 

Bibliographie du projet

  • C. Bernon, D. Capera, J-P. Mano, S. Videau, C. Régis - Towards Self-Modelling of Metabolic Pathways - Journal of Biological Physics and Chemistry, AMSI & Collegium Basilea, Suisse, Géorgie, Vol. 9 N. 1, p. 43-50, mars 2009.
  • C. Bernon, D. Capera, J-P. Mano - Engineering Self-Modeling Systems : Application to Biology - International Workshop on Engineering Societies in the Agents World (ESAW 2008), Saint-Etienne, 24-26 Sept. 2008, A. Artikis, G. Picard, L. Vercouter (Eds.), Springer-Verlag, LNCS 5485, p. 236-251, 2009.

 

Références

  • L.M. Loew, J.C. Schaff « The Virtual Cell : A Software Environment for Computational Cell Biology », Trends in biotechnology regular ed., 19(10):401-406, 2001.
  • T.L. Nissen, U. Schulze, J. Nielsen, J. Villadsen, « Flux Distributions in Anaerobic, Glucose-limited Continuous Cultures of Saccharomyces Cerevisiae », Microbiology Reading, 143(1):203-218, 1997.
  • M. Tomita, K. Hashimoto, K. Thashi, Y. Matsuzaki « E-Cell Project : Towards Integrative Simulation of Cellular Processes », New Generation Computing, 18(1):1-12, 2000.
  • M. Tomita « Whole-cell Simulation : A Grand Challenge of the 21st Century », Trends in Biotechnology regular ed., 19(6):205-210, 2001.
  • P.A. Vanrolleghem, P. De Jong Gubbels, W.M. Van Gulik, J.T. Pronk, J.P. Van Dijken, S. Heijnen «  Validation of a Metabolic Network for Saccharomyces Cerevisiae Using Mixed Substrate Studies » Biotechnology progress, 12(4):434-448, 1996.