Nous proposons un mécanisme qui permet de collecter et modéliser l'ensemble des données provenant des différents capteurs (température, humidité, luminosité, ...) disséminés sur le campus de l'université Paul Sabatier afin de faciliter l'exploitation, l'exploration et la visualisation des données. Ce mécanisme déverse les données dans une base MongoDB accessible via une API dédiée. Il permet d’intégrer des données hétérogènes de source et nature hétérogènes avec vélocité variable. De plus, notre mécanisme offre des facilités de transparence d’interrogation de données pour l’utilisateur. Les requêtes sont écrites à partir d’une connaissance minimale de la structure des données (un schéma existant). Le système de traitement de requêtes prend en compte automatiquement l’hétérogénéité structurelle des données réelles afin de retourner l’ensemble des résultats pertinents pour la requête même si le schéma des données est différent.
Figure 1 : « Cycle de vie des données de capteur neOCampus »
Objectifs scientifiques
Les objectifs de la thèse sont :
- Modélisation et exploration des données big data produites par les capteurs de neOCampus.
- Développement des nouveaux modèles, méthodes et outils pour la refactorisation et l’exploration des données hétérogènes.
- Etude des problèmes liés à l’intégration de données au niveau intra et/ou inter-systèmes NoSQL.
Contacts
hbenhama@irit.fr, canut@irit.fr, peninou@irit.fr, teste@irit.fr