Datanoos : une plateforme au service de la science ouverte au sein de l’UFTMIP

Responsable :  Nathalie AUSSENAC-GILLES

De nombreuses questions autour des données se posent aux personnels de la recherche, qu’ils soient chercheurs, enseignants-chercheurs, ingénieurs, post-doctorant, doctorants, toutes disciplines confondues. Pour répondre à ce besoin, l’alliance académique DataNooS1 vise le partage et le croisement des données de la Recherche, la convergence des ressources Données/Calcul/Contenus et sur les pratiques de la connaissance mixant des approches pluridisciplinaires. Elle regroupe 120 membres issus de 30 entités (laboratoires, unités, fédérations) de l’UFTMiP.

L’alliance privilégie la co-construction interdisciplinaire d’une data NooSphère, un cadre coopératif partagé pour appréhender les problèmes, partager les expertises et les savoir-faire, et enrichir une agora numérique de solutions et pratiques, tourné vers l’innovation. L’alliance réunit ses membres selon une démarche participative et transdisciplinaire autour de la valorisation des données et des connaissances, à savoir : un cycle Atelier / Use Case / Plénière permet de mettre en commun des problématiques, partager des données, co-concevoir un savoir-faire et développer des solutions au sein du centre d’expertises dataCore, répondre à des besoins spécifiques de Formation et élaborer des Projets en partenariat.

DataNoos propose de mettre en place une plateforme (une méta-infrastructure) expérimentale et partenariale qui réponde aux objectifs partagés par ses membres :

  • Accompagner l’ouverture et le partage des données, en particulier issues de la recherche
  • Garantir des données FAIR
  • Faciliter le croisement de plusieurs sources de données
  • Préparer les données pour l’analyse et l’IA

DataNoos mène trois types d’action dont la plateforme est le support :

  • Collecter / restituer des informations à partir de veilles, états de l’art, adoption de recommandations, contributions, évolution des pratiques
  • Impulser des Preuves de Concept/Démonstrateurs
  • Capitaliser et intégrer les résultats de recherche et des expériences des Use Cases

Positionnement de la plateforme par rapport aux plateformes existantes (locales et nationales)

Plateformes existantes (local) :

  • CALLISTO eu sein de CALMIP a vocation à n’être utilisé que par des projets HPC
  • les développements en cours sont en train d’être hébergés au sein d’OSIRIM (prototypage, environnement de développement/test, stockage de données, sémantisation des métadonnées, gestion d’un data lake, …)
  • les dépôts/référentiels de données/publications/codes existants localement TGIR PROGEDO, DataTERRA, GIS GENOTOUL) ou à créer seront progressivement fédérés ou intégrés

Plateformes existantes (au delà) :

  • Réflexions en cours à l’échelle nationale (CNRS, PNSO), européenne (EOSC) et internationale (RDA) autour de fédération de plateformes et de services

Description technique, organisationnelle, taux d’utilisation

Description technique : La plateforme se veut un VRE (Virtual Research Environment) c’est-à-dire une infrastructure distribuée dont le noyau sera hébergé sur OSIRIM. Nous avons retenu CALLISTO (développé par T. Louge de CALMIP), qui s’appuie sur un Dataverse, qui est enrichi pour une meilleur gestion des méta-données et le respect de principes FAIR, auquel on ajoute un accès à un moteur de workflow et la gestion d’un data lake.

Organisation : DataNoos fonctionne avec un comité de pilotage, présidé par Nathalie Aussenac-Gilles, qui coordonne l’ensemble des actions menées par l’alliance dataNooS. Il est constitué de 10 membres venant de pôles disciplinaires impliqués et des animateur.trice.s des groupes de réflexion (use cases et dataCore).

Taux d’utilisation : La plateforme est actuellement utilisée par les partenaires du useCase1 AVION et du projet européen SMS (portés par M. Braza de l’IMFT), par les partenaires du projet ANR Semantics4FAIR (porteur IRIT), en particulier du centre de recherche de MeteoFrance. La plateforme s’ouvre à l’accueil d’autres projets ayant des besoins similaires de stockage et traitements de données comme le projet NeoCampus et le projet SYNERGIE (projet appel unique CNRS).

Site de la plateforme