Olivier Teste

Data Management Systems, Machine Learning

Statut : Professeur des universités
Equipe : Systèmes d'Informations Généralisés (SIG)
Localisation : IRIT1 / Niveau 4, Pièce 411
Mél : Olivier.Teste@irit.fr
Téléphone : 05.61.55.74.35
Adresse : IRIT, équipe SIG
118 Route de Narbonne
31062 Toulouse cedex 09 (France)

  • 30 Mars-2 Avril 2020 : EDBT/ICDT Joint Conference - Copenhagen, Denmark
    C. Lejeune, J. Mothe, O. Teste
    Outlier detection in multivariate functional data based on a geometric aggregation


  • 30 Mars 2020 : DOLAP Workshop - Copenhagen, Denmark
    N. El Malki, F. Ravat, O. Teste
    K-means: k estimation solution based on kd-tree in a massive data context


  • 2020, Juin : CNRS Formation
    M. Chevalier, J. Mothe, O. Teste
    Système de stockage NoSQL (Not Only SQL)

dernière mise à jour : 21/02/2020

Situation actuelle

  • depuis 2015, sept.
    Responsable de Formation, LP APSIO
  • depuis 2012, sept.
    Professeur des Universités, UT2J
    en poste à l' IUT Blagnac
  • depuis 2015, nov.
    Responsable d'Equipe SIG
  • depuis 2001, sept.
    Membre Permanent IRIT
    Unité Mixte de Recherche 5505 du CNRS
  • depuis 2019, nov.
    Membre du Conseil National des Universités, Section CNU27

Enseignement

Situation actuelle

  • depuis 2015, sept. - Responsable de formation
    Licence Professionnelle APSIO (Analyste Programmeur de Systèmes Informatiques Ouverts), Université Toulouse 2 Jean-Jaurès, IUT Blagnac
  • depuis 2012, sept. - Professeur des universités
    Université Toulouse 2 Jean-Jaurès, IUT Blagnac, Département Informatique.

Cours

Diplôme Universitaire de Technologie (DUT - Informatique)

  • L1 - Introduction aux bases de données (Oracle)
  • L1 - Programmation et administration des bases de données (Oracle)
  • L2 - Bases de données avancées (Oracle)
  • L2 - Programmation web côté serveur (MySQL)

Licence Professionnelle (LP - APSIO)

  • L3P - Programmation Web multi-tiers (Microsoft SQL Server, Visual Studio)

Méthodes Informatiques Appliquées à la Gestion des Entreprises (MASTER MIAGE)

  • M1 - Décentralisation des données
  • M2 - Nouveaux paradigmes de la donnée (noSQL)
  • M2 - Traitements des données massives (Big Data)
  • M2 - Entrepôts de données multidimensionnelles (OLAP)

Recherche

Situation actuelle

  • depuis 2015, nov. - Responsable de l'équipe Systèmes d'Informations Généralisés (SIG)
  • depuis 2001, sept. - Membre permanent de l'Institut en Informatique de Toulouse (IRIT-CNRS/UMR5505)

Thèmes de recherche

Mes recherches se situent dans le domaine des systèmes d'informations, et concernent principalement les systèmes de gestion non conventionnelle des données (Data Management Systems ), et l'apprentissage machine (Machine Learning ) dans les données massives.

L'objet de mes recherches est les données (Data) et les traitements visant à intégrer, structurer et analyser ces données. Mes recherches concernent les masses de données volumineuses, de structuration disparate (structurées à non-structurées), largement distribuées, et constituées de contenus atomiques, textuels ou de formes élaborées (tabulaires, hiérarchiques ou graphes, séries-temporelles, ensembles de pixels). Les collections de données étudiées sont des données industrielles (aéronautique, compagnies d'assurance, énergie, biologie, santé), des benchmarks scientifiques (OAEI, SSB, TPC-H...), les données Web et UGC (sites Web, plateformes collaboratives, microblogs), les données ouvertes et liées sémantiquement (Open Data, Ontologies, Linked Data).

Ces masses de données sont de nos jours exploitables pour aider aux processus de décision dans des domaines d'application variés tels que la maintenance prédictive, l'aide au diagnostic, etc. Mes recherches s'inscrivent dans le cadre de la science des données, et traitent des algorithmes d'apprentissage automatique basés sur des méthodes statistiques (Machine Learning) et des réseaux de neurones artificiels (Deep Learning) afin de détecter et de prédire des phénomènes complexes cachés au sein des masses de données. Ces approches permettent de construire des systèmes d'intelligence artificielle.

Les problématiques étudiées dans mes recherches couvrent une large part de la chaîne de traitement des données, allant des processus d'acquisition, de la modélisation des données, jusqu'à l'analyse des données massives. Mes contributions s'articulent en 3 volets :

  1. Intégration automatique de données hétérogènes [ISWC'16]

  2. Modélisation et Manipulation non conventionnelles des données
  3. Apprentissage machine dans les données massives
    • Détection d'anomalies dans les séries temporelles EDBT'20 (à paraître)
    • Détection d'influences dans les graphes bipartis [DASFAA'17]

Doctorants

Thèses en cours

  • 2019, déc. - Abderaheman Yewgat
    Apprentissage profond par renforcement de modèles physiques pour la prédiction dans les champs pétrolifères et gaziers

  • 2019, nov. - Ginel Dorleon
    Qualification des biais dans les données des systèmes décisionnels et prédictifs de santé

  • 2019, avr. - Elliot Maitre
    Détection de signaux faibles par apprentissage profond dans les séries temporelles hybrides dans les données massives multi-sources

  • 2018, fév. - Oihana Coustié
    Apprentissage automatique dans les logs avions du système d’information embarqué

  • 2018, fév. - Clément Lejeune
    Apprentissage automatique pour l’analyse de séries temporelles multivariées dans les essais en vol
    EDBT'20 (à paraître)

  • 2018, janv. - Ines Ben Kraiem
    Détection d’anomalies multiples par apprentissage automatique de patterns dans les séries temporelles issues capteurs d'énergies
    ICEIS'19

  • 2017, déc. - Nabil El Malki
    Accélération par pré-agrégations des accès complexes et répétitifs aux Big Data
    DOLAP'20 (à paraître) ICEIS'19

Thèses soutenues

  • 2016-2019 - Amir Laadhar
    Local Matching Learning of Large Scale Biomedical Ontologies
    Mémoire :

  • 2016-2019 - Hamdi Ben Hamadou
    Querying Heterogeneous Data in NoSQL Document Stores
    Mémoire :

  • 2014-2017 - Baptiste De La Robertie
    Modèles d'Autorité et d'Expertise par les Graphes Hétérogènes. Application aux plateformes collaboratives et librairies digitales
    Mémoire :

  • 2013-2016 - Mohammed El Malki
    Modélisation NoSQL des entrepôts de données multidimensionnelles massives
    Mémoire :

  • 2012-2015 - Imen Megdiche
    Intégration holistique et entreposage automatique des Open Data
    Mémoire :

  • 2010-2014 Ali Hassan
    Modélisation des bases de données multidimensionnelles : analyse par fonctions d’agrégation multiples
    Mémoire :

Publications

Référencements

Publications Récentes

2020

  • F. Ravat, J. Song, O. Teste, C. Trojahn
    Efficient querying of multidimensional RDF data with aggregates: comparing NoSQL, RDF and relational data stores
    International Journal of Information Management, Elsevier Science Publisher
    2020
  • C. Lejeune, J. Mothe, O. Teste
    Outlier detection in multivariate functional data based on a geometric aggregation
    23th EDBT/ICDT Joint Conference, International Conference on Extending Database Technology (EDBT/ICDT’20), Copenhagen, Denmark
    2020
  • N. El Malki, F. Ravat, O. Teste
    K-means: k estimation solution based on kd-tree in a massive data context
    22th International Workshop On Design, Optimization, Languages and Analytical Processing of Big Data, co-located with the 23th EDBT/ICDT Joint Conference (DOLAP@EDBT/ICDT'20), Copenhagen, Denmark
    2020

2019

  • H. Ben Hamadou, F. Ghozzi, A. Péninou, O. Teste
    Schema-independent Querying for Heterogeneous Collections in NoSQL Document Stores
    Information Systems Journal, Elsevier Science Publisher, Vol. 85, p.48-67
    2019
  • A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri
    The Impact of Imbalanced training Data on Local matching learning of ontologie
    22nd International Conference on Business Information Systems (BIS’19), Seville, Spain
    2019
  • A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri
    Partitioning and Local Matching Learning of Biomedical Ontologies
    34th ACM/SIGAPP Symposium On Applied Computing (SAC’19), Limassol, Cyprus
    2019
  • F. Ravat, J. Song, O. Teste, C. Trojahn
    Improving the performance of querying multidimensional RDF data using aggregates
    34th ACM/SIGAPP Symposium On Applied Computing (SAC’19), Limassol, Cyprus
    2019
  • I. Ben Kraiem, F. Ghozzi, A. Peninou, O. Teste
    Pattern-based method for anomaly detection in sensor networks
    21st International Conference on Enterprise Information Systems (ICEIS’19), Heraklion, Crete, Greece
    2019 Best student paper award
  • N. El Malki, F. Ravat, O. Teste
    K-means improvement by dynamic pre-aggregates
    21st International Conference on Enterprise Information Systems (ICEIS’19), Heraklion, Crete, Greece
    2019
  • A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri
    POMap++ Results for OAEI 2019: Fully Automated Machine Learning Approach for Ontology Matching
    14th International Workshop on Ontology Matching co-located with the 18th International Semantic Web Conference (OM@ISWC'19), Auckland, New Zelaand
    2019