Des chercheurs de l’IRIT récompensés à la conférence MTSR 2021

Logo MTSR 2021
Infrared satellite imagery provides temperature data of tropical storm. Coldest cloud tops circling the center resembled a strawberry and leaf. Elements of this image furnished by NASA./ Image Adobe Stock

Un groupe de chercheurs de l’équipe MELODI de l’IRIT composé de Amina Annane, Mouna Kamel, Nathalie Aussenac-Gilles, Cassia Trojahn, Catherine Comparot et Christophe Baehr du Centre National de Recherches Météorologiques de Météo France (CNRM), a été récompensé dans le cadre de la conférence Metada and Semantics Research Conference (MTSR) 2021. La quinzième Conférence sur la recherche en matière de métadonnées et de sémantique a décerné le prix du 2e meilleur article au travail de recherche intitulé “Towards the FAIRification of Meteorological Data: a Meteorological Semantic Model” / “Vers la FAIRification des données météorologiques : un modèle sémantique météorologique”.

Un modèle sémantique en vue d’améliorer la FAIRisation des données météorologiques

Selon OuvrirLaScience.fr, les principes FAIR sont un “ensemble de principes directeurs pour gérer les données de la recherche visant à les rendre faciles à trouver, accessibles, interopérables et réutilisables par l’homme et la machine.” L’intérêt du groupe de travail récompensé porte précisément sur les données météorologiques. L’introduction de l’article met en perspective les enjeux liés à ce domaine. En effet, “rendre les données météorologiques FAIR dans le but de faciliter leur réutilisation est un enjeu stratégique car ce sont des données essentielles à la recherche scientifique dans de nombreux domaines. Cet article propose un modèle sémantique associant un modèle de métadonnées et un modèle de données pour décrire les données météorologiques d’observation. En effet, la modélisation des (méta)données est une étape essentielle vers leur FAIRisation. Nous utilisons le jeu de données “SYNOP” de Météo France pour illustrer les difficultés liées à l’accès et à la compréhension de ce type de données, et pour montrer comment le modèle proposé améliore leur adhésion aux principes “F”, “I”, et “R”.

Une démarche pluridisciplinaire

Ce travail de recherche s’inscrit dans une démarche pluridisciplinaire. Il est en effet déployé dans le cadre du projet ANR Semantic4FAIR et bénéficie du soutien de l’alliance DataNoos. Le but du projet Semantics4FAIR est de permettre à des communautés scientifiques de trouver, adapter et réutiliser aisément les données produites par Météo France. Il s’agit d’outiller la description de ces données de façon adaptée aux futurs utilisateurs alors que les métadonnées et descriptions actuelles sont, lorsqu’elles existent, calquées sur le point de vue des producteurs des données.

DataNoos, l’Alliance académique transdisciplinaire sur les ressources numériques et les pratiques de connaissance, explique l’intérêt d’une démarche interdisciplinaire : “Pour faciliter l’accès aux données par des non-spécialistes en météorologie, nous avons proposé une réponse interdisciplinaire associant des informaticiens, des chercheurs en sciences humaines (ergonomie) de la Maison des Sciences Humaines et Sociales de Toulouse (MSHS-T) et en météorologie, des producteurs de données (Météo France) et des utilisateurs de ces données (OMP). Nous avons retenu une approche utilisant des ontologies et des vocabulaires formels définissant de manière unique les concepts, propriétés et entités nécessaires pour définir des métadonnées riches et compréhensibles. La représentation sémantique permet de raisonner sur ces données au moment de les rechercher, et facilite leur alignement avec d’autres données ouvertes.