Enseignement
Situation actuelle
- depuis 2012, sept. - Professeur des universités
Université Toulouse 2 Jean-Jaurès, IUT Blagnac, Département Informatique.
Cours
Bachelor universitaire de technologie (BUT - Informatique)
- L1 - Introduction aux bases de données (Oracle)
- L1 - Exploitation des bases de données (Oracle)
Diplôme Universitaire de Technologie (DUT - Informatique)
- L2 - Bases de données avancées (Oracle)
Licence Professionnelle (LP - APSIO)
- L3P - Programmation Web multi-tiers (Microsoft SQL Server, Visual Studio)
Méthodes Informatiques Appliquées à la Gestion des Entreprises (Master - MIAGE)
- M1 - Décentralisation des données
- M2 - Nouveaux paradigmes de la donnée (noSQL)
- M2 - Traitements des données massives (Big Data)
- M2 - Entrepôts de données multidimensionnelles (OLAP)
Recherche
Situation actuelle
- depuis 2015, nov. - Responsable de l'équipe Systèmes d'Informations Généralisés (SIG)
- depuis 2001, sept. - Membre permanent de l'Institut en Informatique de Toulouse (IRIT-CNRS/UMR5505)
Thèmes de recherche
Mes recherches se situent dans le domaine des systèmes d'informations, et concernent principalement les systèmes de gestion non conventionnelle des données ( CCS.Information systems.Data management systems ), et l'apprentissage machine ( CCS.Computing methodologies.Machine learning ) dans les données massives.
L'objet des recherches que je mène est la donnée numérisée (Data) à partir de différents systèmes de production et d'acquisition de données, et les traitements associés visant à intégrer, structurer et analyser ces données (Data Management). Mes recherches portent en particulier sur les masses de données (Big Data) volumineuses, de structuration disparate (structurées à non-structurées), possiblement largement distribuées, pouvant être constituées de contenus atomiques, textuels ou de formes élaborées (tabulaires, graphes, séries-temporelles, ensembles de pixels). Les collections de données étudiées, sur les quelles mes travaux sont mis en oeuvre, sont : des données industrielles (aéronautique, assurance, énergie, biologie, santé), des benchmarks scientifiques (OAEI, SSB, TPC-H...), des données issues du Web (sites, réseaux sociaux, plateformes collaboratives), et les données ouvertes, pouvant être liées sémantiquement (Open Data, Ontologies, Linked Data).
Ces masses de données sont exploitables pour aider aux processus de décision dans des domaines d'application variés tels que la maintenance prédictive, l'aide au diagnostics... Mes recherches s'inscrivent dans le cadre de la science des données, et traitent des algorithmes d'apprentissage machine (Machine Learning) et des réseaux de neurones artificiels (Deep Learning). Ces algorithmes permettent de détecter et de prédire des phénomènes complexes cachés au sein des masses de données, afin de construire des systèmes d'intelligence artificielle (Artificial Intelligence).
Les problématiques étudiées couvrent une large part de la chaîne de traitement des données, allant des processus d'acquisition et de modélisation des données, jusqu'à l'analyse des données massives. Elles s'articulent en 2 volets :
- Data Management
- Intégration automatique de données hétérogènes [ISWC'16]
- Systèmes de stockage de données massives (noSQL) [InfSyst'19]
- Entrepôts de données multidimensionnelles (OLAP) [InfSyst'10] [IJDWM'08]
- Machine Learning
- Détection d'anomalies dans les séries temporelles [KnoSyst'20]
- Clustering dans les données massives [CIKM'20]
- Réseaux d'influences dans les graphes bipartis (Web) [DASFAA'17]
Doctorants
Thèses en cours
- 2021, nov. - Léa El Ahdab Interrogation polyglotte des systèmes multi-stores
- 2021, sept. - Robin Cugny Expliquer et valider par l'exemple un modèle : Application à un Sosie Virtuel Projectif
- 2021, sept. - Abdoulaye Diop Découverte de relations dans des ensembles de données hétérogènes en grande dimension (approche par multiview clustering)
- 2021, sept. - Vincent Fraysse Le Federated-Learning au service du Sosie Virtuel Projectif
- 2020, sept. - Tianyi Li Intelligence Artificielle pour la détection et la prédiction de turbulences ICDM-W'21
- 2020, avr. - Michele Lazzara Apprentissage automatique appliqué aux séries temporelles hybrides issues des capteurs avions et modèles physiques
- 2019, déc. - Abderaheman Yewgat Apprentissage profond contraint par modèles physiques pour la prédiction dans les champs pétrolifères et gaziers ECMOR'20
- 2019, nov. - Ginel Dorleon Qualification des biais dans les données des systèmes décisionnels et prédictifs de santé DSIT'21
- 2019, avr. - Elliot Maitre Détection de signaux faibles par apprentissage profond dans les séries temporelles hybrides dans les données massives multi-sources CIRCLE'20
Thèses soutenues
2021
- Oihana Coustié Detecting anomalies in modern IT systems through the inference of structure and the detection of novelties in system logs Mémoire :
- Clément Lejeune Multivariate Functional Data: Geometric Features Extraction and Sparse Learning of Dynamics Mémoire :
- Ines Ben Kraiem Détection d’Anomalies Multiples par Apprentissage Automatique de Règles dans les Séries Temporelles Mémoire :
2020
- Nabil El Malki Nouvelles Approches basées sur la Partition et la Densité pour l'Amélioration du Regroupement (Clustering) Mémoire :
2019
- Amir Laadhar Local Matching Learning of Large Scale Biomedical Ontologies Mémoire :
- Hamdi Ben Hamadou Querying Heterogeneous Data in NoSQL Document Stores Mémoire :
- Franck Boizard Application de la biologie des systèmes pour l'identification de marqueurs moléculaires des maladies rénales dans les fluides biologiques Mémoire :
2017
- Baptiste De La Robertie Modèles d'Autorité et d'Expertise par les Graphes Hétérogènes. Application aux plateformes collaboratives et librairies digitales Mémoire :
2016
- Mohammed El Malki Modélisation NoSQL des entrepôts de données multidimensionnelles massives Mémoire :
2015
2014
Publications
Référencements
-
Publications IRIT
DBLP computer science bibliography
Google Scholar
ORCID connecting research and researchers
Microsoft Academic
Publons
Research Gate
Publications Récentes
2021
- F. Boizard, B. Buffin-Meyer, J. Aligon, O. Teste, J. P. Schanstra, J. Klein PRYNT: a tool for prioritization of disease candidates from proteomics data using a combination of shortest-path and random walk algorithms Scientific Reports, Open Access Journal, ISSN 2045-2322 2021
- T. Li, P. Goupil, J. Mothe, O. Teste Early Detection of Atmospheric Turbulence for Civil Aircraft: A Data Driven Approach 21st Industrial Conference on Data Mining Workshops (ICDM-W'21), Auckland, New Zealand 2021
- N. El Malki, R. Cugny, O. Teste, F. Ravat A New Accurate Clustering Approach for Detecting Different Densities in High Dimensional Data 23rd International Conference Big Data Analytics and Knowledge Discovery (DaWaK'21), virtual event 2021
- Y. Yang, F. Abdelhédi, J. Darmont, F. Ravat, O. Teste Internal Data Imputation in Data Warehouse Dimensions 32nd International Conference Database and Expert Systems Applications (DEXA'21), virtual event 2021
- Y. Yang, J. Darmont, F. Ravat, O. Teste An Automatic Schema-Instance Approach for Merging Multidimensional Data Warehouses 25th International Database Engineering & Applications Symposium (IDEAS'21), Montreal, QC, Canada 2021
- G. Dorleon, N. Bricon-Souf, I. Megdiche, O. Teste Absolute Redundancy Analysis Based on Features Selection 4th International Conference on Data Science and Information Technology (DSIT'21), Shanghai 2021
- I. Ben Kraiem, F. Ghozzi, A. Péninou, G. Roman-Jimenez, O. Teste Human-Interpretable Rules for Anomaly Detection in Time-series 24th EDBT/ICDT Joint Conference, International Conference on Extending Database Technology (EDBT/ICDT’21), Nicosia, Cyprus 2021
2020
- C. Lejeune, J. Mothe, A. Soubki, O. Teste Shape-based outlier detection in multivariate functional data International Journal of Knowledge-Based Systems, Elsevier Science Publisher 2020
- F. Ravat, J. Song, O. Teste, C. Trojahn Efficient querying of multidimensional RDF data with aggregates: comparing NoSQL, RDF and relational data stores International Journal of Information Management, Elsevier Science Publisher 2020
- O. Coustié, X. Baril, J. Mothe, O. Teste Application Performance Anomaly Detection with LSTM on Temporal Irregularities in Logs 29th International Conference on Information and knowledge Management (CIKM’20), Galway, Ireland 2020
- N. El Malki, R. Cugny, F. Ravat, O. Teste DECWA: Density-Based Clustering using Wasserstein Distance 29th International Conference on Information and knowledge Management (CIKM’20), Galway, Ireland 2020
- O. Coustié, X. Baril, J. Mothe, O. Teste METING: A Robust Log Parser Based on Frequent n-Gram Mining IEEE International Conference on Web Services (ICWS’20), Beijing, China 2020
- O. El Rifai, M. Biotteau, X. Deboissezon, I. Medgiche, F. Ravat, O. Teste Blockchain-based Federated Learning in Medecine International Conference on Artificial Intelligence in Medicine (AIME'20), Minneapolis, USA 2020
- A. Yewgat, D. Busby, M. Chevalier, C. Lapeyre, O. Teste Deep-CRM: A New Deep Learning Approach For Capacitance Resistive Models 17th European Conference On The Mathematics Of Oil Recovery (ECMOR'20) 2020
- I. Ben Kraiem, F. Ghozzi, A. Péninou, G. Roman-Jimenez, O. Teste Automatic Classification Rules for Anomaly Detection in Time-series 14th International Conference on Research Challenges in Information Science (RCIS’20), Limassol, Cyprus 2020
- O. El Rifai, M. Biotteau, X. Deboissezon, I. Medgiche, F. Ravat, O. Teste Blockchain-Based Personal Health Records for Patients’ Empowerment 14th International Conference on Research Challenges in Information Science (RCIS’20), Limassol, Cyprus 2020
- E. Maître, Z. Chemli, M. Chevalier, B. Dousset, J-P. Gitto, O. Teste Event detection and time series alignment to improve stock market forecasting Joint Conference of the Information Retrieval Communities in Europe (CIRCLE'20), Samatan, France 2020
- K. Demestichas, T.B.N. Hoang, J. Mothe, O. Teste, Md. Zia Ullah Prediction and Visual Intelligence for Security Information: The PREVISION H2020 Project Joint Conference of the Information Retrieval Communities in Europe (CIRCLE'20), Samatan, France 2020
- C. Lejeune, J. Mothe, O. Teste Outlier detection in multivariate functional data based on a geometric aggregation 23th EDBT/ICDT Joint Conference, International Conference on Extending Database Technology (EDBT/ICDT’20), Copenhagen, Denmark 2020
- N. El Malki, F. Ravat, O. Teste K-means: k estimation solution based on kd-tree in a massive data context 22th International Workshop On Design, Optimization, Languages and Analytical Processing of Big Data, co-located with the 23th EDBT/ICDT Joint Conference (DOLAP@EDBT/ICDT'20), Copenhagen, Denmark 2020
2019
- H. Ben Hamadou, F. Ghozzi, A. Péninou, O. Teste Schema-independent Querying for Heterogeneous Collections in NoSQL Document Stores Information Systems Journal, Elsevier Science Publisher, Vol. 85, p.48-67 2019
- A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri The Impact of Imbalanced training Data on Local matching learning of ontologie 22nd International Conference on Business Information Systems (BIS’19), Seville, Spain 2019
- A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri Partitioning and Local Matching Learning of Biomedical Ontologies 34th ACM/SIGAPP Symposium On Applied Computing (SAC’19), Limassol, Cyprus 2019
- F. Ravat, J. Song, O. Teste, C. Trojahn Improving the performance of querying multidimensional RDF data using aggregates 34th ACM/SIGAPP Symposium On Applied Computing (SAC’19), Limassol, Cyprus 2019
- I. Ben Kraiem, F. Ghozzi, A. Peninou, O. Teste CoRP: A Pattern-Based Anomaly Detection in Time-Series Enterprise Information Systems, Revised Selected Papers, International Conference on Enterprise Information Systems (ICEIS’19), Lecture Notes in Business Information Processing (LNBIP), Vol. 241, Springer, ISBN 978-3-030-40782-7, p. 424-442 2019
- I. Ben Kraiem, F. Ghozzi, A. Peninou, O. Teste Pattern-based method for anomaly detection in sensor networks 21st International Conference on Enterprise Information Systems (ICEIS’19), Heraklion, Crete, Greece 2019 Best student paper award
- N. El Malki, F. Ravat, O. Teste K-means improvement by dynamic pre-aggregates 21st International Conference on Enterprise Information Systems (ICEIS’19), Heraklion, Crete, Greece 2019
- A. Laadhar, F. Ghozzi, I. Megdiche, F. Ravat, O. Teste, F. Gargouri POMap++ Results for OAEI 2019: Fully Automated Machine Learning Approach for Ontology Matching 14th International Workshop on Ontology Matching co-located with the 18th International Semantic Web Conference (OM@ISWC'19), Auckland, New Zelaand 2019