Enseignement
Situation actuelle
- depuis 2012, sept. - Professeur des universités
Université Toulouse 2 Jean-Jaurès, IUT Blagnac, Département Informatique.
Cours
Bachelor universitaire de technologie (BUT - Informatique)
- L1 - Introduction aux bases de données (Oracle)
- L1 - Exploitation des bases de données (Oracle)
Diplôme Universitaire de Technologie (DUT - Informatique)
- L2 - Bases de données avancées (Oracle)
Licence Professionnelle (LP - APSIO)
- L3P - Programmation Web multi-tiers (Microsoft SQL Server, Visual Studio)
Méthodes Informatiques Appliquées à la Gestion des Entreprises (Master - MIAGE)
- M1 - Décentralisation des données
- M2 - Nouveaux paradigmes de la donnée (noSQL)
- M2 - Traitements des données massives (Big Data)
- M2 - Entrepôts de données multidimensionnelles (OLAP)
Recherche
Situation actuelle
- depuis 2015, nov. - Responsable de l'équipe Systèmes d'Informations Généralisés (SIG)
- depuis 2001, sept. - Membre permanent de l'Institut en Informatique de Toulouse (IRIT-CNRS/UMR5505)
Thèmes de recherche
Mes recherches se situent dans le domaine des systèmes d'informations,
et concernent principalement les systèmes de gestion non conventionnelle des données
(
CCS.Information systems.Data management systems
),
et l'apprentissage machine (
CCS.Computing methodologies.Machine learning
)
dans les données massives.
L'objet des recherches que je mène est la donnée numérisée (Data) à partir de différents systèmes de production et d'acquisition de données, et les traitements associés visant à intégrer, structurer et analyser ces données (Data Management). Mes recherches portent en particulier sur les masses de données (Big Data) volumineuses, de structuration disparate (structurées à non-structurées), possiblement largement distribuées, pouvant être constituées de contenus atomiques, textuels ou de formes élaborées (tabulaires, graphes, séries-temporelles, ensembles de pixels). Les collections de données étudiées, sur les quelles mes travaux sont mis en oeuvre, sont : des données industrielles (aéronautique, assurance, énergie, biologie, santé), des benchmarks scientifiques (OAEI, SSB, TPC-H...), des données issues du Web (sites, réseaux sociaux, plateformes collaboratives), et les données ouvertes, pouvant être liées sémantiquement (Open Data, Ontologies, Linked Data).
Ces masses de données sont exploitables pour aider aux processus de décision dans des domaines d'application variés tels que la maintenance prédictive, l'aide au diagnostics... Mes recherches s'inscrivent dans le cadre de la science des données, et traitent des algorithmes d'apprentissage machine (Machine Learning) et des réseaux de neurones artificiels (Deep Learning). Ces algorithmes permettent de détecter et de prédire des phénomènes complexes cachés au sein des masses de données, afin de construire des systèmes d'intelligence artificielle (Artificial Intelligence).
Les problématiques étudiées couvrent une large part de la chaîne de traitement des données, allant des processus d'acquisition et de modélisation des données, jusqu'à l'analyse des données massives. Elles s'articulent en 2 volets :
- Data Management
- Intégration automatique de données hétérogènes [ISWC'16]
- Systèmes de stockage de données massives (noSQL) [InfSyst'19]
- Entrepôts de données multidimensionnelles (OLAP) [InfSyst'10] [IJDWM'08]
- Machine Learning
- Détection d'anomalies dans les séries temporelles [KnoSyst'20]
- Clustering dans les données massives [CIKM'20]
- Réseaux d'influences dans les graphes bipartis (Web) [DASFAA'17]
Doctorants
Thèses en cours
- 2021, nov. - Léa El Ahdab Interrogation polyglotte des systèmes multi-stores
- 2021, sept. - Robin Cugny Expliquer et valider par l'exemple un modèle : Application à un Sosie Virtuel Projectif
- 2021, sept. - Abdoulaye Diop Découverte de relations dans des ensembles de données hétérogènes en grande dimension (approche par multiview clustering)
- 2021, sept. - Vincent Fraysse Le Federated-Learning au service du Sosie Virtuel Projectif
- 2020, sept. - Tianyi Li Intelligence Artificielle pour la détection et la prédiction de turbulences ICDM-W'21
- 2020, avr. - Michele Lazzara Apprentissage automatique appliqué aux séries temporelles hybrides issues des capteurs avions et modèles physiques
- 2019, déc. - Abderaheman Yewgat Apprentissage profond contraint par modèles physiques pour la prédiction dans les champs pétrolifères et gaziers ECMOR'20
- 2019, nov. - Ginel Dorleon Qualification des biais dans les données des systèmes décisionnels et prédictifs de santé DSIT'21
- 2019, avr. - Elliot Maitre Détection de signaux faibles par apprentissage profond dans les séries temporelles hybrides dans les données massives multi-sources CIRCLE'20
Thèses soutenues
2021
- Oihana Coustié
Detecting anomalies in modern IT systems through the inference of structure and the detection of novelties in system logs
Mémoire :
- Clément Lejeune
Multivariate Functional Data: Geometric Features Extraction and Sparse Learning of Dynamics
Mémoire :
- Ines Ben Kraiem
Détection d’Anomalies Multiples par Apprentissage Automatique de Règles dans les Séries Temporelles
Mémoire :
2020
- Nabil El Malki
Nouvelles Approches basées sur la Partition et la Densité pour l'Amélioration du Regroupement (Clustering)
Mémoire :
2019
- Amir Laadhar
Local Matching Learning of Large Scale Biomedical Ontologies
Mémoire :
- Hamdi Ben Hamadou
Querying Heterogeneous Data in NoSQL Document Stores
Mémoire :
- Franck Boizard
Application de la biologie des systèmes pour l'identification de marqueurs moléculaires des maladies rénales dans les fluides biologiques
Mémoire :
2017
- Baptiste De La Robertie
Modèles d'Autorité et d'Expertise par les Graphes Hétérogènes. Application aux plateformes collaboratives et librairies digitales
Mémoire :
2016
- Mohammed El Malki
Modélisation NoSQL des entrepôts de données multidimensionnelles massives
Mémoire :
2015
2014
Publications
Référencements







Publications Récentes
2021
-
F. Boizard, B. Buffin-Meyer, J. Aligon, O. Teste, J. P. Schanstra, J. Klein PRYNT: a tool for prioritization of disease candidates from proteomics data using a combination of shortest-path and random walk algorithms Scientific Reports, Open Access Journal, ISSN 2045-2322 2021
-
T. Li, P. Goupil, J. Mothe, O. Teste
Early Detection of Atmospheric Turbulence for Civil Aircraft: A Data Driven Approach
21st Industrial Conference on Data Mining Workshops (ICDM-W'21), Auckland, New Zealand
2021
-
N. El Malki, R. Cugny, O. Teste, F. Ravat
A New Accurate Clustering Approach for Detecting Different Densities in High Dimensional Data
23rd International Conference Big Data Analytics and Knowledge Discovery (DaWaK'21), virtual event
2021
-
Y. Yang, F. Abdelhédi, J. Darmont, F. Ravat, O. Teste
Internal Data Imputation in Data Warehouse Dimensions
32nd International Conference Database and Expert Systems Applications (DEXA'21), virtual event
2021
-
Y. Yang, J. Darmont, F. Ravat, O. Teste
An Automatic Schema-Instance Approach for Merging Multidimensional Data Warehouses
25th International Database Engineering & Applications Symposium (IDEAS'21), Montreal, QC, Canada
2021
-
G. Dorleon, N. Bricon-Souf, I. Megdiche, O. Teste
Absolute Redundancy Analysis Based on Features Selection
4th International Conference on Data Science and Information Technology (DSIT'21), Shanghai
2021
-
I. Ben Kraiem, F. Ghozzi, A. Péninou, G. Roman-Jimenez, O. Teste
Human-Interpretable Rules for Anomaly Detection in Time-series
24th EDBT/ICDT Joint Conference, International Conference on Extending Database Technology (EDBT/ICDT’21), Nicosia, Cyprus
2021
2020
-
C. Lejeune, J. Mothe, A. Soubki, O. Teste Shape-based outlier detection in multivariate functional data International Journal of Knowledge-Based Systems, Elsevier Science Publisher 2020
-
F. Ravat, J. Song, O. Teste, C. Trojahn Efficient querying of multidimensional RDF data with aggregates: comparing NoSQL, RDF and relational data stores International Journal of Information Management, Elsevier Science Publisher 2020
-
O. Coustié, X. Baril, J. Mothe, O. Teste
Application Performance Anomaly Detection with LSTM on Temporal Irregularities in Logs
29th International Conference on Information and knowledge Management (CIKM’20), Galway, Ireland
2020
-
N. El Malki, R. Cugny, F. Ravat, O. Teste
DECWA: Density-Based Clustering using Wasserstein Distance
29th International Conference on Information and knowledge Management (CIKM’20), Galway, Ireland
2020
-
O. Coustié, X. Baril, J. Mothe, O. Teste
METING: A Robust Log Parser Based on Frequent n-Gram Mining
IEEE International Conference on Web Services (ICWS’20), Beijing, China
2020
-
O. El Rifai, M. Biotteau, X. Deboissezon, I. Medgiche, F. Ravat, O. Teste
Blockchain-based Federated Learning in Medecine
International Conference on Artificial Intelligence in Medicine (AIME'20), Minneapolis, USA
2020
-
A. Yewgat, D. Busby, M. Chevalier, C. Lapeyre, O. Teste
Deep-CRM: A New Deep Learning Approach For Capacitance Resistive Models
17th European Conference On The Mathematics Of Oil Recovery (ECMOR'20)
2020
-
I. Ben Kraiem, F. Ghozzi, A. Péninou, G. Roman-Jimenez, O. Teste
Automatic Classification Rules for Anomaly Detection in Time-series
14th International Conference on Research Challenges in Information Science (RCIS’20), Limassol, Cyprus
2020
-
O. El Rifai, M. Biotteau, X. Deboissezon, I. Medgiche, F. Ravat, O. Teste
Blockchain-Based Personal Health Records for Patients’ Empowerment
14th International Conference on Research Challenges in Information Science (RCIS’20), Limassol, Cyprus
2020
-
E. Maître, Z. Chemli, M. Chevalier, B. Dousset, J-P. Gitto, O. Teste
Event detection and time series alignment to improve stock market forecasting
Joint Conference of the Information Retrieval Communities in Europe (CIRCLE'20), Samatan, France
2020
-
K. Demestichas, T.B.N. Hoang, J. Mothe, O. Teste, Md. Zia Ullah
Prediction and Visual Intelligence for Security Information: The PREVISION H2020 Project
Joint Conference of the Information Retrieval Communities in Europe (CIRCLE'20), Samatan, France
2020
-
C. Lejeune, J. Mothe, O. Teste
Outlier detection in multivariate functional data based on a geometric aggregation
23th EDBT/ICDT Joint Conference, International Conference on Extending Database Technology (EDBT/ICDT’20), Copenhagen, Denmark
2020
-
N. El Malki, F. Ravat, O. Teste
K-means: k estimation solution based on kd-tree in a massive data context
22th International Workshop On Design, Optimization, Languages and Analytical Processing of Big Data, co-located with the 23th EDBT/ICDT Joint Conference (DOLAP@EDBT/ICDT'20), Copenhagen, Denmark
2020
2019
-
H. Ben Hamadou, F. Ghozzi, A. Péninou, O. Teste Schema-independent Querying for Heterogeneous Collections in NoSQL Document Stores Information Systems Journal, Elsevier Science Publisher, Vol. 85, p.48-67 2019
-
A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri
The Impact of Imbalanced training Data on Local matching learning of ontologie
22nd International Conference on Business Information Systems (BIS’19), Seville, Spain
2019
-
A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri
Partitioning and Local Matching Learning of Biomedical Ontologies
34th ACM/SIGAPP Symposium On Applied Computing (SAC’19), Limassol, Cyprus
2019
-
F. Ravat, J. Song, O. Teste, C. Trojahn
Improving the performance of querying multidimensional RDF data using aggregates
34th ACM/SIGAPP Symposium On Applied Computing (SAC’19), Limassol, Cyprus
2019
-
I. Ben Kraiem, F. Ghozzi, A. Peninou, O. Teste
CoRP: A Pattern-Based Anomaly Detection in Time-Series
Enterprise Information Systems, Revised Selected Papers, International Conference on Enterprise Information Systems (ICEIS’19),
Lecture Notes in Business Information Processing (LNBIP), Vol. 241, Springer, ISBN 978-3-030-40782-7, p. 424-442
2019
-
I. Ben Kraiem, F. Ghozzi, A. Peninou, O. Teste
Pattern-based method for anomaly detection in sensor networks
21st International Conference on Enterprise Information Systems (ICEIS’19), Heraklion, Crete, Greece
2019
Best student paper award
-
N. El Malki, F. Ravat, O. Teste
K-means improvement by dynamic pre-aggregates
21st International Conference on Enterprise Information Systems (ICEIS’19), Heraklion, Crete, Greece
2019
-
A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri
POMap++ Results for OAEI 2019: Fully Automated Machine Learning Approach for Ontology Matching
14th International Workshop on Ontology Matching co-located with the 18th International Semantic Web Conference (OM@ISWC'19), Auckland, New Zelaand
2019