Olivier Teste

Data Management, Machine Learning

Statut : Professeur des universités
Equipe : Systèmes d'Informations Généralisés (SIG)
Localisation : IRIT1 / Niveau 4, Pièce 411
Mél : Olivier.Teste@irit.fr
Téléphone : 05.61.55.74.35
Adresse : IRIT, équipe SIG
118 Route de Narbonne
31062 Toulouse cedex 09 (France)

Actualité


  • 2022, 25-29 April : 37th ACM/SIGAPP Symposium On Applied Computing (poster) - virtual conference
    G. Dorleon, I. Megdiche, N. Bricon-Souf, O. Teste
    Feature Selection under Fairness Constraints


  • 2022, 22-24 Juin : CNRS Formation
    M. Chevalier, J. Mothe, O. Teste
    Système de stockage NoSQL (Not Only SQL)


dernière mise à jour : 03/02/2022

Situation actuelle

  • depuis 2012, sept.
    Professeur des Universités, UT2J
    en poste à l' IUT Blagnac
  • depuis 2015, nov.
    Responsable d'Equipe SIG
  • depuis 2001, sept.
    Membre Permanent IRIT
    Unité Mixte de Recherche 5505 du CNRS
  • depuis 2019, nov.
    Membre du Conseil National des Universités, Section CNU27

Enseignement

Situation actuelle

  • depuis 2012, sept. - Professeur des universités
    Université Toulouse 2 Jean-Jaurès, IUT Blagnac, Département Informatique.

Cours

Bachelor universitaire de technologie (BUT - Informatique)

  • L1 - Introduction aux bases de données (Oracle)
  • L1 - Exploitation des bases de données (Oracle)

Diplôme Universitaire de Technologie (DUT - Informatique)

  • L2 - Bases de données avancées (Oracle)

Licence Professionnelle (LP - APSIO)

  • L3P - Programmation Web multi-tiers (Microsoft SQL Server, Visual Studio)

Méthodes Informatiques Appliquées à la Gestion des Entreprises (Master - MIAGE)

  • M1 - Décentralisation des données
  • M2 - Nouveaux paradigmes de la donnée (noSQL)
  • M2 - Traitements des données massives (Big Data)
  • M2 - Entrepôts de données multidimensionnelles (OLAP)

Recherche

Situation actuelle

  • depuis 2015, nov. - Responsable de l'équipe Systèmes d'Informations Généralisés (SIG)
  • depuis 2001, sept. - Membre permanent de l'Institut en Informatique de Toulouse (IRIT-CNRS/UMR5505)

Thèmes de recherche

Mes recherches se situent dans le domaine des systèmes d'informations, et concernent principalement les systèmes de gestion non conventionnelle des données ( CCS.Information systems.Data management systems ), et l'apprentissage machine ( CCS.Computing methodologies.Machine learning ) dans les données massives.

L'objet des recherches que je mène est la donnée numérisée (Data) à partir de différents systèmes de production et d'acquisition de données, et les traitements associés visant à intégrer, structurer et analyser ces données (Data Management). Mes recherches portent en particulier sur les masses de données (Big Data) volumineuses, de structuration disparate (structurées à non-structurées), possiblement largement distribuées, pouvant être constituées de contenus atomiques, textuels ou de formes élaborées (tabulaires, graphes, séries-temporelles, ensembles de pixels). Les collections de données étudiées, sur les quelles mes travaux sont mis en oeuvre, sont : des données industrielles (aéronautique, assurance, énergie, biologie, santé), des benchmarks scientifiques (OAEI, SSB, TPC-H...), des données issues du Web (sites, réseaux sociaux, plateformes collaboratives), et les données ouvertes, pouvant être liées sémantiquement (Open Data, Ontologies, Linked Data).

Ces masses de données sont exploitables pour aider aux processus de décision dans des domaines d'application variés tels que la maintenance prédictive, l'aide au diagnostics... Mes recherches s'inscrivent dans le cadre de la science des données, et traitent des algorithmes d'apprentissage machine (Machine Learning) et des réseaux de neurones artificiels (Deep Learning). Ces algorithmes permettent de détecter et de prédire des phénomènes complexes cachés au sein des masses de données, afin de construire des systèmes d'intelligence artificielle (Artificial Intelligence).

Les problématiques étudiées couvrent une large part de la chaîne de traitement des données, allant des processus d'acquisition et de modélisation des données, jusqu'à l'analyse des données massives. Elles s'articulent en 2 volets :

  1. Data Management

  2. Machine Learning
    • Détection d'anomalies dans les séries temporelles [KnoSyst'20]
    • Clustering dans les données massives [CIKM'20]
    • Réseaux d'influences dans les graphes bipartis (Web) [DASFAA'17]

Doctorants

Thèses en cours

  • 2021, nov. - Léa El Ahdab
    Interrogation polyglotte des systèmes multi-stores

  • 2021, sept. - Robin Cugny
    Expliquer et valider par l'exemple un modèle : Application à un Sosie Virtuel Projectif

  • 2021, sept. - Abdoulaye Diop
    Découverte de relations dans des ensembles de données hétérogènes en grande dimension (approche par multiview clustering)

  • 2021, sept. - Vincent Fraysse
    Le Federated-Learning au service du Sosie Virtuel Projectif

  • 2020, sept. - Tianyi Li
    Intelligence Artificielle pour la détection et la prédiction de turbulences
    ICDM-W'21

  • 2020, avr. - Michele Lazzara
    Apprentissage automatique appliqué aux séries temporelles hybrides issues des capteurs avions et modèles physiques

  • 2019, déc. - Abderaheman Yewgat
    Apprentissage profond contraint par modèles physiques pour la prédiction dans les champs pétrolifères et gaziers
    ECMOR'20

  • 2019, nov. - Ginel Dorleon
    Qualification des biais dans les données des systèmes décisionnels et prédictifs de santé
    DSIT'21

  • 2019, avr. - Elliot Maitre
    Détection de signaux faibles par apprentissage profond dans les séries temporelles hybrides dans les données massives multi-sources
    CIRCLE'20

Thèses soutenues

2021

  • Oihana Coustié
    Detecting anomalies in modern IT systems through the inference of structure and the detection of novelties in system logs
    Mémoire :

  • Clément Lejeune
    Multivariate Functional Data: Geometric Features Extraction and Sparse Learning of Dynamics
    Mémoire :

  • Ines Ben Kraiem
    Détection d’Anomalies Multiples par Apprentissage Automatique de Règles dans les Séries Temporelles
    Mémoire :

2020

  • Nabil El Malki
    Nouvelles Approches basées sur la Partition et la Densité pour l'Amélioration du Regroupement (Clustering)
    Mémoire :

2019

  • Amir Laadhar
    Local Matching Learning of Large Scale Biomedical Ontologies
    Mémoire :

  • Hamdi Ben Hamadou
    Querying Heterogeneous Data in NoSQL Document Stores
    Mémoire :

  • Franck Boizard
    Application de la biologie des systèmes pour l'identification de marqueurs moléculaires des maladies rénales dans les fluides biologiques
    Mémoire :

2017

  • Baptiste De La Robertie
    Modèles d'Autorité et d'Expertise par les Graphes Hétérogènes. Application aux plateformes collaboratives et librairies digitales
    Mémoire :

2016

  • Mohammed El Malki
    Modélisation NoSQL des entrepôts de données multidimensionnelles massives
    Mémoire :

2015

  • Imen Megdiche
    Intégration holistique et entreposage automatique des Open Data
    Mémoire :

2014

  • Ali Hassan
    Modélisation des bases de données multidimensionnelles : analyse par fonctions d’agrégation multiples
    Mémoire :

Publications

Référencements

Publications Récentes

2021

  • F. Boizard, B. Buffin-Meyer, J. Aligon, O. Teste, J. P. Schanstra, J. Klein
    PRYNT: a tool for prioritization of disease candidates from proteomics data using a combination of shortest-path and random walk algorithms
    Scientific Reports, Open Access Journal, ISSN 2045-2322
    2021
  • T. Li, P. Goupil, J. Mothe, O. Teste
    Early Detection of Atmospheric Turbulence for Civil Aircraft: A Data Driven Approach
    21st Industrial Conference on Data Mining Workshops (ICDM-W'21), Auckland, New Zealand
    2021
  • N. El Malki, R. Cugny, O. Teste, F. Ravat
    A New Accurate Clustering Approach for Detecting Different Densities in High Dimensional Data
    23rd International Conference Big Data Analytics and Knowledge Discovery (DaWaK'21), virtual event
    2021
  • Y. Yang, F. Abdelhédi, J. Darmont, F. Ravat, O. Teste
    Internal Data Imputation in Data Warehouse Dimensions
    32nd International Conference Database and Expert Systems Applications (DEXA'21), virtual event
    2021
  • Y. Yang, J. Darmont, F. Ravat, O. Teste
    An Automatic Schema-Instance Approach for Merging Multidimensional Data Warehouses
    25th International Database Engineering & Applications Symposium (IDEAS'21), Montreal, QC, Canada
    2021
  • G. Dorleon, N. Bricon-Souf, I. Megdiche, O. Teste
    Absolute Redundancy Analysis Based on Features Selection
    4th International Conference on Data Science and Information Technology (DSIT'21), Shanghai
    2021
  • I. Ben Kraiem, F. Ghozzi, A. Péninou, G. Roman-Jimenez, O. Teste
    Human-Interpretable Rules for Anomaly Detection in Time-series
    24th EDBT/ICDT Joint Conference, International Conference on Extending Database Technology (EDBT/ICDT’21), Nicosia, Cyprus
    2021

2020

  • C. Lejeune, J. Mothe, A. Soubki, O. Teste
    Shape-based outlier detection in multivariate functional data
    International Journal of Knowledge-Based Systems, Elsevier Science Publisher
    2020
  • F. Ravat, J. Song, O. Teste, C. Trojahn
    Efficient querying of multidimensional RDF data with aggregates: comparing NoSQL, RDF and relational data stores
    International Journal of Information Management, Elsevier Science Publisher
    2020
  • O. Coustié, X. Baril, J. Mothe, O. Teste
    Application Performance Anomaly Detection with LSTM on Temporal Irregularities in Logs
    29th International Conference on Information and knowledge Management (CIKM’20), Galway, Ireland
    2020
  • N. El Malki, R. Cugny, F. Ravat, O. Teste
    DECWA: Density-Based Clustering using Wasserstein Distance
    29th International Conference on Information and knowledge Management (CIKM’20), Galway, Ireland
    2020
  • O. Coustié, X. Baril, J. Mothe, O. Teste
    METING: A Robust Log Parser Based on Frequent n-Gram Mining
    IEEE International Conference on Web Services (ICWS’20), Beijing, China
    2020
  • O. El Rifai, M. Biotteau, X. Deboissezon, I. Medgiche, F. Ravat, O. Teste
    Blockchain-based Federated Learning in Medecine
    International Conference on Artificial Intelligence in Medicine (AIME'20), Minneapolis, USA
    2020
  • A. Yewgat, D. Busby, M. Chevalier, C. Lapeyre, O. Teste
    Deep-CRM: A New Deep Learning Approach For Capacitance Resistive Models
    17th European Conference On The Mathematics Of Oil Recovery (ECMOR'20)
    2020
  • I. Ben Kraiem, F. Ghozzi, A. Péninou, G. Roman-Jimenez, O. Teste
    Automatic Classification Rules for Anomaly Detection in Time-series
    14th International Conference on Research Challenges in Information Science (RCIS’20), Limassol, Cyprus
    2020
  • O. El Rifai, M. Biotteau, X. Deboissezon, I. Medgiche, F. Ravat, O. Teste
    Blockchain-Based Personal Health Records for Patients’ Empowerment
    14th International Conference on Research Challenges in Information Science (RCIS’20), Limassol, Cyprus
    2020
  • E. Maître, Z. Chemli, M. Chevalier, B. Dousset, J-P. Gitto, O. Teste
    Event detection and time series alignment to improve stock market forecasting
    Joint Conference of the Information Retrieval Communities in Europe (CIRCLE'20), Samatan, France
    2020
  • K. Demestichas, T.B.N. Hoang, J. Mothe, O. Teste, Md. Zia Ullah
    Prediction and Visual Intelligence for Security Information: The PREVISION H2020 Project
    Joint Conference of the Information Retrieval Communities in Europe (CIRCLE'20), Samatan, France
    2020
  • C. Lejeune, J. Mothe, O. Teste
    Outlier detection in multivariate functional data based on a geometric aggregation
    23th EDBT/ICDT Joint Conference, International Conference on Extending Database Technology (EDBT/ICDT’20), Copenhagen, Denmark
    2020
  • N. El Malki, F. Ravat, O. Teste
    K-means: k estimation solution based on kd-tree in a massive data context
    22th International Workshop On Design, Optimization, Languages and Analytical Processing of Big Data, co-located with the 23th EDBT/ICDT Joint Conference (DOLAP@EDBT/ICDT'20), Copenhagen, Denmark
    2020

2019

  • H. Ben Hamadou, F. Ghozzi, A. Péninou, O. Teste
    Schema-independent Querying for Heterogeneous Collections in NoSQL Document Stores
    Information Systems Journal, Elsevier Science Publisher, Vol. 85, p.48-67
    2019
  • A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri
    The Impact of Imbalanced training Data on Local matching learning of ontologie
    22nd International Conference on Business Information Systems (BIS’19), Seville, Spain
    2019
  • A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri
    Partitioning and Local Matching Learning of Biomedical Ontologies
    34th ACM/SIGAPP Symposium On Applied Computing (SAC’19), Limassol, Cyprus
    2019
  • F. Ravat, J. Song, O. Teste, C. Trojahn
    Improving the performance of querying multidimensional RDF data using aggregates
    34th ACM/SIGAPP Symposium On Applied Computing (SAC’19), Limassol, Cyprus
    2019
  • I. Ben Kraiem, F. Ghozzi, A. Peninou, O. Teste
    CoRP: A Pattern-Based Anomaly Detection in Time-Series
    Enterprise Information Systems, Revised Selected Papers, International Conference on Enterprise Information Systems (ICEIS’19), Lecture Notes in Business Information Processing (LNBIP), Vol. 241, Springer, ISBN 978-3-030-40782-7, p. 424-442
    2019
  • I. Ben Kraiem, F. Ghozzi, A. Peninou, O. Teste
    Pattern-based method for anomaly detection in sensor networks
    21st International Conference on Enterprise Information Systems (ICEIS’19), Heraklion, Crete, Greece
    2019 Best student paper award
  • N. El Malki, F. Ravat, O. Teste
    K-means improvement by dynamic pre-aggregates
    21st International Conference on Enterprise Information Systems (ICEIS’19), Heraklion, Crete, Greece
    2019
  • A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri
    POMap++ Results for OAEI 2019: Fully Automated Machine Learning Approach for Ontology Matching
    14th International Workshop on Ontology Matching co-located with the 18th International Semantic Web Conference (OM@ISWC'19), Auckland, New Zelaand
    2019