PHARMAKON, plateforme d’exploration de la chimiodiversité du vivant

Responsable :  Guillaume CABANAC

 Pharmakon est le produit d’une collaboration avec deux laboratoires : 

  • PharmaDEV : Pharmacochimie et Biologie pour le Développement (UMR 152 IRD UT3) 
  • LRSV : Laboratoire de Recherche en Sciences Végétales (UMR 5546 CNRS UT3) 

Pharmakon résulte d’un processus d’intégration de données ouvertes (10 sources telles que Universal Natural Product Database, Human Metabolome Database, KnapSack et CheBi) ou soumises à abonnement (source Dictionary of Natural Products). Au total, 626 970 produits naturels sont répertoriés et décrits avec des métadonnées utiles à la recherche en biochimie : descripteurs moléculaires, origine biologique de chaque composé, classification dans la taxonomie du vivant (règne, famille, genre, espèce), ontologie chimique (alcaloïdes, terpènes, acides gras…), référencement des identifiants d’interopérabilités avec les bases de données ouvertes et ressource bibliographique pour chaque composé. À notre connaissance, Pharmakon est aujourd’hui la base de données relationnelles la plus complète en termes de couverture de la diversité chimique du vivant. 

Pharmakon est parfaitement adapté pour les recherches en métabolomique. Il s’agit ici d’identifier les molécules présentes dans des mélanges complexes issus de plantes, microorganismes (champignons, bactéries), biofluides (plasma, urine…) analysés par chromatographie en phase liquide couplée à la spectrométrie de masse (LC/MS). Les données chromatographiques issues de la LC/MS sont ainsi annotées grâce aux ressources recensées dans la base de données de Pharmakon. Cette approche est en plein essor tant en recherche clinique (stratification des patients, recherche de biomarqueurs physiopathologiques) qu’en recherche agronomique (symbiose, biocontrôle raisonné) et s’inscrit dans les approches holistiques telles que « One Health ». Pharmakon réduit le temps de préparation des données pour une interrogation des données spectrales LC/MS : d’une matinée d’ingénieur à quelques minutes seulement (une saisie et un téléchargement). L’algorithme MS-CleanR développé par le consortium autour de ce projet (Fraisier-Vannier et al., 2020) permet d’améliorer la pertinence des résultats obtenus tout en réduisant considérablement le temps d’analyse

Cette ressource est aussi exploitée afin de comprendre les mécanismes sous-jacents à l’origine de la chimiodiversité du vivant et de leurs interactions. La mise en commun de plusieurs couches d’informations orthogonales telles que l’origine taxonomique des composés et leurs ontologies respectives associées à leurs activités biologiques (anticancéreux, antibiotiques…) permet d’inférer et de prioriser la recherche de nouveaux actifs chez des taxons d’intérêts. Cette approche a fait l’objet d’une première publication en 2019 (Chassagne et al., 2019). 

Pharmakon est aussi une base d’étude pour la scientométrie. En effet, les premières publications relevées dans la base datent du début du XXe siècle avec la découverte de la Quinine (premier antipaludéen au monde) ou encore de la pénicilline. C’est donc plus d’un siècle d’histoire et d’évolution de la chimie des substances naturelles et de la pharmacognosie qui peuvent être retracées à l’aide de cette ressource. Des premiers résultats très encourageants nous enjoignent à poursuivre ces travaux, notamment avec la collaboration de Bruno David, ancien conseiller au ministère de la Recherche sous François Hollande et chercheur émérite chez Pierre Fabre médicament. 

L’ensemble de ces travaux ont été présentés au domaine d’application stratégique « Santé, autonomie, bien-être » de l’IRIT le 19/07/2019 : diaporama intitulé « La métabolomique globale : une approche holistique de la biologie des systèmes » ainsi qu’à l’université d’Emory (Atlanta, USA) : Marti G., Big Data Learning for metabolomics. The Impact of Biodiversity on Human Health, The Role of Biodiversity in Disease Ecology and Evolution; 16-18 octobre 2019; Emory University.

Usagers

Pharmakon est utilisé par les laboratoires PharmaDEV (20 chercheurs et EC) et le LRSV (80 chercheurs et EC) de l’Université Paul Sabatier. Une partie de nos développements est accessible aux membres de Metatoul (40 C et EC): la plateforme toulousaine (INRAE, INSA, INSERM, CNRS, UT3) de l’infrastructure nationale en métabolomique MetaboHUB. Des partenaires à l’étranger exploitent également Pharmakon (Fabio Espichan Jauregui, doctorant, Universidad Peruana Cayetano Heredia,Pérou ; Chiobuaphong Pakavoalay, EC, Université de pharmacie du Laos). 

Positionnement de la plateforme par rapport aux plateformes existantes (locales et nationales) 

La plateforme Pharmakon est un outil unique en son genre, tant en termes de nombres de composés référencés que par la diversité des métadonnées disponibles. À notre connaissance, aucune plateforme de ce type n’est présente au niveau national. Les bases de données internationales ouvertes sont généralement limitées dans leur couverture (HMDB pour les informations cliniques en santé humaine, plantcyc pour les plantes, NPatlas pour les microorganismes…) et leurs thématiques ce qui ne permet pas d’organiser l’information de manière holistique, comme peut le faire Pharmakon. Un autre écueil important est l’homogénéisation des données et leur interopérabilité. En effet nous avons décelé énormément d’erreurs de référencement au cours de la capture des données de plusieurs bases ouvertes qui ont été résolues au sein de Pharmakon. 

Description technique, organisationnelle, taux d’utilisation 

Les données sont stockées sur le serveur Oracle du laboratoire. Une interface web APEX (technologie Oracle) permet aux chercheurs d’explorer les données de Pharmakon ainsi que de télécharger les données nécessaires à l’identification des pics sur les sorties de la LC/MS ou pour exploiter les métadonnées pour des projets d’inférence de données. L’accès à Pharmakon est restreint à nos collaborateurs privilégiés dans le cadre de projets communs. Le taux d’utilisation est donc relativement restreint du fait d’une approche « requête-téléchargement » que nous avons privilégiée. Une ouverture plus large a été envisagée via TTT, mais n’a pas encore abouti notamment due au temps à consacrer pour finaliser une reconfiguration de cette plateforme en Open Access ou une valorisation avec un partenaire industriel.