Equipe SIG

Responsable : Olivier TESTE

L’équipe SIG, Systèmes d’Informations Généralisés (« Information Systems »), est une équipe qui existe depuis la création de l’IRIT, et constitue l’une des plus grandes équipes du laboratoire avec 21 enseignants-chercheurs en poste dans 4 universités de la région Occitanie : Université Toulouse 1 Capitole, Université Toulouse 2 Jean Jaurès, Université Toulouse 3 Paul Sabatier, Université Jean François Champollion (Ecole ISIS, Castres). L’équipe compte aussi près d’une trentaine d’étudiants post-doctorants, doctorants ou stagiaires, et d’ingénieurs de recherche.

Les recherches développées par l’équipe SIG concernent la donnée (« data »), en particulier la gestion des données et le traitement des masses de données actuelles (« Big Data »). Ils visent à développer des méthodes, modèles, langages et outils qui permettent un accès simple et efficace à l’information pertinente pour permettre ou en améliorer l’usage, faciliter l’analyse et aider à la prise de décisions.

Nos travaux concernent une grande variété de collections de données : bases de données scientifiques et des entreprises (aéronautique, espace, énergie, biologie, santé…), le Web et les applications mobiles actuelles (user generated content), les données ouvertes (open data), les benchmarks scientifiques (CLEF, OAEI, SSB, TPC-H/DS, TREC…), les connaissances ou données sémantiques (ontologies), les capteurs et les objets connectés (IoT)…

Les travaux de recherche de l’équipe SIG couvrent toute la chaîne de traitement de la donnée, allant des données brutes aux données élaborées accessibles pour les utilisateurs cherchant de l’information, souhaitant la visualiser et effectuer des analyses décisionnelles et prédictives.

PNG - 6.3 ko

Figure 1 : Chaîne de traitement de la donnée.
Ces travaux s’articulent en 4 volets.

Intégration automatique de données hétérogènes

Les données disponibles de nos jours constituent des masses de données volumineuses, de structuration disparate (structurées, semi-structurées à non-structurées), largement distribuées et souvent très hétérogènes. Nos travaux portent sur les différentes facettes de l’hétérogénéité : hétérogénéité d’entités, hétérogénéité structurelle, hétérogénéité syntaxique et sémantique des éléments.

L’enjeu est de développer des méthodes et algorithmes permettant de retrouver de manière automatique les correspondances entre les éléments issus deux ou de multiples sources (« alignements holistiques ») de données et de connaissances. Les correspondances cherchées peuvent être simples 1:1 ou complexes 1:n (ou n:1) et n:m.

Gestion des bases données non-conventionnelles

Les systèmes de gestion de base de données modernes doivent de nos jours être capables de prendre en charge des grands volumes de données, caractérisées par une importante variété (données conventionnelles comme les bases relationnelles, documents structurés – XML, JSON –, collections de textes, ontologies de domaines…). Ils ne reposent plus sur un modèle uniformément structuré et standard (relationnel), mais reposent sur des systèmes de stockage centralisés (data warehouse, data lake) ou distribués basés sur des paradigmes non-conventionnels (orientés clé-valeur, orientés document, orientés colonne, orientés graphe). Ces systèmes non conventionnels sont aussi appelés noSQL (not only SQL).

Dans ce contexte multi-modèle, l’enjeu consiste à développer de nouvelles méthodes de conception intégrant des modèles de représentation des données clairement formalisés (concepts et formalismes), et les langages de manipulations associés. Chaque langage défini doit assurer la complétude d’un noyau algébrique fermé d’opérateurs élémentaires, assurant la couverture du modèle, garantissant la validité et la puissance du langage.

Données orientées-utilisateurs

La connaissance de l’utilisateur est essentielle dès que l’on souhaite développer des systèmes complexes, capables d’être plus efficaces, et éventuellement de s’adapter. Cette connaissance est le plus souvent basée sur la construction d’un profil utilisateur, défini comme un ensemble de données caractérisant l’usager, son contexte et l’usage.

Dans ce contexte, nos travaux portent sur la définition de profils utilisateurs contextuels (spatio-temporels, égocentrés) relatifs à un utilisateur ou un groupe d’utilisateurs. Nous exploitons ces profils pour développer des approches algorithmiques dans les systèmes de recommandation et de filtrage d’informations (diversité) ainsi que dans le contexte de l’analyse des réseaux sociaux (détection de communautés, de fraudes, d’influences, de sentiments).

Analyse, apprentissage et prédiction dans les données massives

L’avènement des Big Data révolutionne l’informatique. L’humanité produit de nos jours des masses de données gigantesques, au travers du réseau mondialisé Internet, des appareils mobiles et l’Internet des objets, mais également par des infrastructures scientifiques de d’observation et captation (satellites, accélérateurs de particules, séquenceurs d’ADN…). Selon une étude IDC pour EMC (The digital universe of opportunities) parue en avril 2014, le volume de données produites devrait être multiplié par 10 entre 2013 et 2020 (44 Zettabytes). De nouveaux algorithmes sont aujourd’hui développés au-dessus de clusters de machines rendant possible l’analyse, et la réalisation de simulations et de prédictions à partir de ces masses de données.

L’équipe SIG mène des recherches sur la paramétrisation d’algorithmes d’analyse et de fouille de données (data mining), d’apprentissage automatique (machine learning) et profond (deep learning). L’intelligence de la donnée est un enjeu de la science des données, qui dépend de l’efficacité des algorithmes et des méthodes d’analyse. Ces approches doivent être mise en place en garantissant la reproductibilité la plus large possible. Ceci est généralement difficile à satisfaire car les collections de données volumineuses et hétérogènes sont souvent de qualité variable, et réparties selon des distributions déséquilibrées ou éparses. Ces caractéristiques obligent des paramétrisations précises rendant les approches spécifiques à un sous ensemble réduit de données.

Compétences

Intégration automatique de données hétérogènes
Modélisation et Manipulation des bases de données non-conventionnelles (entrepôts, datalakes, multistores noSQL)
Analyses de documents et médias sociaux
Fouille de données
Apprentissage machine dans les masses de données multimodales

personnel de l’équipe

Membres permanents
Membres non – permanents

publications de l’équipe

Articles dans des revues internationales
  • Franck Boizard, Bénédicte Buffin-Meyer, Julien Aligon, Olivier Teste, Joost Schanstra, Julie Klein

    PRYNT: a tool for prioritization of disease candidates from proteomics data using a combination of shortest-path and random walk algorithms

    Scientific Reports, Nature Publishing Group, 2021, 11 (1), pp.Article number: 5764 (2021). ⟨10.1038/s41598-021-85135-3⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03268300

  • Gabriel Ferrettini, Elodie Escriva, Julien Aligon, Jean-Baptiste Excoffier, Chantal Soulé-Dupuy

    Coalitional Strategies for Efficient Individual Prediction Explanation

    Information Systems Frontiers, Springer Verlag, 2021, pp.1-31. ⟨10.1007/s10796-021-10141-9⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03259008

  • Nathalie Neptune, Josiane Mothe

    Automatic Annotation of Change Detection Images

    Sensors, MDPI, 2021, 21 (4), pp.1110. ⟨10.3390/s21041110⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03150419

  • Geoffrey Roman Jimenez, Patrice Guyot, Thierry Malon, Sylvie Chambon, Vincent Charvillat, Alain Crouzil, André Péninou, Julien Pinquier, Florence Sèdes, Christine Senac

    Improving vehicle re‐identification using CNN latent spaces: Metrics comparison and track‐to‐track extension

    IET Computer Vision, IET, 2021, 15 (2), pp.85-98. ⟨10.1049/cvi2.12010⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03126045

  • Fatma Abdelhedi, Amal Ait Brahim, Gilles Zurfluh

    OCL Constraints Checking on NoSQL Systems Through an MDA-Based Approach

    International Journal of Data Warehousing and Mining (IJDWM), IGI Global, 2021, 17 (1), pp.1-14. ⟨10.4018/IJDWM.2021010101⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03237658

  • Xavier Baril, Oihana Coustié, Josiane Mothe, Olivier Teste

    RFreeStem : Une méthode de racinisation indépendante de la langue et sans règle

    Revue ouverte d’ingénierie des systèmes d’information, ISTE, 2021, 2 (1), pp.1-29. ⟨10.21494/ISTE.OP.2021.0605⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03121993

  • Franck Ravat, Jiefu Song, Olivier Teste, Cassia Trojahn dos Santos

    Efficient querying of multidimensional RDF data with aggregates: Comparing NoSQL, RDF and relational data stores

    International Journal of Information Management, Elsevier, 2020, 54, pp.102089. ⟨10.1016/j.ijinfomgt.2020.102089⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03079830

  • Bastien Vidé, Max Chevalier, Franck Ravat

    Enterprise Knowledge Graph : définition et contribution à un système ‘Team of Teams

    Revue des Nouvelles Technologies de l’Information, Editions RNTI, 2020, RNTI-B-16, pp.60-68

    Accès: https://hal.archives-ouvertes.fr/hal-03123181

  • Maryse Salles, Raphaëlle Bour, Rémi Jardat

    Systèmes d’information numériques : supports ou entraves à la démocratie dans les organisations ?

    Revue Ouverte de l’Ingénierie des Systèmes d’Information (ROISI), © ISTE Ltd, 2020, 2, ⟨10.21494/ISTE.OP.2020.0499⟩

    Accès: https://hal.archives-ouvertes.fr/hal-02543729

  • Maha Ben Kraiem, Mohamed Alqarni, Jamel Feki, Franck Ravat

    OLAP operators for social network analysis

    Cluster Computing, Springer Verlag, 2020, 23 (1), pp.2347-2374. ⟨10.1007/s10586-019-03006-z⟩

    Accès: https://hal.archives-ouvertes.fr/hal-02923943

  • Articles dans des revues nationales
  • Maryse Salles, Raphaëlle Bour

    Présentation du numéro « Impact des systèmes d’information sur la démocratie dans les organisations »

    Revue Ouverte de l’Ingénierie des Systèmes d’Information (ROISI), © ISTE Ltd, 2020, 1 (2), pp.0

    Accès: https://hal.archives-ouvertes.fr/hal-02938631

  • Nathalie Aussenac-Gilles, Nathalie Souf, Lynda Tamine

    Introduction

    Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, Lavoisier, 2018, Information médicale : représentation et traitement, 37 (1-6), pp.7-9. ⟨10.3166/tsi37-0006⟩

    Accès: https://hal.archives-ouvertes.fr/hal-02924569

  • Mahdi Washha, Manel Mezghani, Florence Sèdes

    Qualité de l’information dans les réseaux sociaux : une méthode collaborative pour détecter les spams dans les tweets

    Document Numérique, Lavoisier, 2018, 21 (3), pp.33-53. ⟨10.3166/DN.21.3.33-53⟩

    Accès: https://hal.archives-ouvertes.fr/hal-02451040

  • Mahdi Washha, Manel Mezghani, Florence Sèdes

    Behavioural account-based features for filtering out social spammers in large-scale twitter data collections

    Revue des Sciences et Technologies de l’Information – Série ISI : Ingénierie des Systèmes d’Information, Lavoisier, 2017, 22 (3), pp.65-88. ⟨10.3166/ISI.22.3.65-88⟩

    Accès: https://hal.archives-ouvertes.fr/hal-02548073

  • Sandrine Vaton, Florence Sèdes

    Egalité Femmes-Hommes & « numérique » : le point de vue de Sandrine Vaton, référente égalité à Télécom Bretagne (propos recueillis par Florence Sédès)

    1024 : Bulletin de la Société Informatique de France, Société Informatique de France, 2017, Hors Série numéro 2: Femmes & Informatique (2), pp.83 – 88

    Accès: https://hal.archives-ouvertes.fr/hal-01511374

  • Max Chevalier, Mohammed El Malki, Arlind Kopliku, Olivier Teste, Ronan Tournier

    Entrepôts de données orientés documents : cuboïdes étendus – Modèles et cuboïdes NoSQL orientés documents

    Document Numérique, Lavoisier, 2017, 20 (1), pp.9-38. ⟨10.3166/dn.2017.00001⟩

    Accès: https://hal.archives-ouvertes.fr/hal-02558102

  • Articles dans des revues nationales
    Rédaction de numéros spéciaux de revues
    Conférences et workshops internationaux avec actes édités et comité de lecture
  • Yuzhao Yang, Fatma Abdelhedi, Jérôme Darmont, Franck Ravat, Olivier Teste

    Internal Data Imputation in Data Warehouse Dimensions

    32nd International Conference on Database and Expert Systems Applications (DEXA 2021), Sep 2021, Linz, Austria. pp.237-244, ⟨10.1007/978-3-030-86472-9_22⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03265060

  • Liana Ermakova, Patrice Bellot, Pavel Braslavski, Jaap Kamps, Josiane Mothe, Diana Nurbakova, Irina Ovchinnikova, Eric Sanjuan

    Overview of SimpleText CLEF 2021 Workshop and Pilot Tasks

    12th Conference and Labs of the Evaluation Forum (CLEF 2021), Sep 2021, Bucharest (on line), Romania. pp.2212 – 2227

    Accès: https://hal.archives-ouvertes.fr/hal-03328174

  • Ken Andriamahery-Ranjalahy, Léa Berquez, Nadine Jessel, Philippe Truillet

    TabGO: towards accessible computer science in secondary school

    23rd International Conference on Human-Computer Interaction (HCI International 2021 ), Jul 2021, virtual place, United States

    Accès: https://hal.archives-ouvertes.fr/hal-03168307

  • Ginel Dorleon, Nathalie Bricon-Souf, Imen Megdiche, Olivier Teste

    Absolute Redundancy Analysis Based on Features Selection

    4th International Conference on Data Science and Information Technology (DSIT 2021), The International Society for Applied Computing (ISAC), Jul 2021, Shangai (virtual), China. pp.1-4, ⟨10.1145/3478905.3479002⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03333976

  • Max Chevalier, Joan Marty, Franck Ravat, Bastien Vidé

    Designing a Business View of Enterprise Data: An approach based on a Decentralised Enterprise Knowledge Graph

    25th International Database Engineering and Applications Symposium (IDEAS 2021), Concordia Univesity with the cooperation of BytePress.org, Jul 2021, Montréal (virtual), Canada. ⟨10.1145/3472163.3472276⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03304542

  • Yan Zhao, Julien Aligon, Gabriel Ferrettini, Imen Megdiche, Franck Ravat, Chantal Soulé-Dupuy

    Analysis-oriented Metadata for Data Lakes

    25th International Database Engineering & Applications Symposium (IDEAS 2021), Jul 2021, Montreal, Canada

    Accès: https://hal.archives-ouvertes.fr/hal-03269221

  • Vincent-Nam Dang, Yan Zhao, Imen Megdiche, Franck Ravat

    A Zone-Based Data Lake Architecture for IoT, Small and Big Data

    25th International Database Engineering & Applications Symposium (IDEAS 2021), Jul 2021, Montreal, Canada

    Accès: https://hal.archives-ouvertes.fr/hal-03269224

  • Yuzhao Yang, Jérôme Darmont, Franck Ravat, Olivier Teste

    An Automatic Schema-Instance Approach for Merging Multidimensional Data Warehouses

    25th International Database Engineering & Applications Symposium (IDEAS 2021), Jul 2021, Montreal, Canada. pp.232-241, ⟨10.1145/3472163.3472268⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03265061

  • Elliot Maître, Zakaria Chemli, Max Chevalier, Bernard Douset, Jean-Philippe Gitto, Olivier Teste

    Étude de l’influence des représentations textuelles sur la détection d’évènements non supervisée dans des flux de données

    XXXIXème Congrès INFormatique des ORganisations et Systèmes d’Information et de Décision (INFORSID 2021), Jun 2021, Dijon (virtuel), France. pp.23-38

    Accès: https://hal.archives-ouvertes.fr/hal-03324781

  • Raphaëlle Bour, Maryse Salles

    Ingénierie d’une méthode pour évaluer l’impact d’un SI sur la démocratie d’une organisation

    39ème Congrès INFormatique des Organisations et des Systèmes d’Information et de Décision (INFORSID 2021), Jun 2021, Dijon (virtuel), France. pp.87-102

    Accès: https://hal.archives-ouvertes.fr/hal-03276002

  • Conférences et workshops nationaux avec actes édités et comité de lecture
  • Adriana Soveja, André Péninou, Adrien van Den Bossche., Thierry Val, Thierry Alhalel

    Etudes énergétiques des parois rayonnantes réalisées en brique HELIOTERRE

    Congrès National de la Recherche des IUT (CNRIUT 2021), ADIUT : Assemblée des Directeurs d’IUT, Jun 2021, Lyon (en ligne), France

    Accès: https://hal.archives-ouvertes.fr/hal-03196608

  • Thierry Val, Réjane Dalce, Imen Megdiche, Oussema Fakhakh, Khawla Ltifi

    Etude, conception, réalisation et tests d’une nouvelle canne connectée intelligente multi-technologie radio

    Congrès National de la Recherche des IUT (CNRIUT 2021), ADIUT : Assemblée des Directeurs d’IUT, Jun 2021, Lyon (en ligne), France

    Accès: https://hal.archives-ouvertes.fr/hal-03195002

  • Yuzhao Yang, Jérôme Darmont, Franck Ravat, Olivier Teste

    Automatic Integration Issues of Tabular Data for On-Line Analysis Processing

    16e journées EDA Business Intelligence & Big Data (EDA 2020), Aug 2020, Lyon, France. pp.5-18

    Accès: https://hal.archives-ouvertes.fr/hal-02889486v2

  • Amal Ait Brahim, Rabah Tighilt Ferhat, Gilles Zurfluh

    Approche dirigée par les modèles pour l’extraction automatique du modèle NoSQL

    Journees Francophones sur les Entrepots de Donnees et l’Analyse en ligne (EDA 2019), Oct 2019, Montpellier, France. pp.45-60

    Accès: https://hal.archives-ouvertes.fr/hal-02950715

  • Philippe Roussille, Imen Megdiche, Olivier Teste, Cassia Trojahn dos Santos

    Booster le matching holistique : un jeu d’alignement de référence basé sur les cliques relaxés

    30es Journées Francophones d’Ingénierie des Connaissances, IC 2019, AFIA, Jul 2019, Toulouse, France. pp.143

    Accès: https://hal.archives-ouvertes.fr/hal-02556902

  • Inès Ben Kraiem, Faiza Ghozzi, André Péninou, Olivier Teste

    Méthode à base de patterns pour la détection d’anomalies

    37e Congres Informatique des Organisations et Systemes d’Information et de Decision (INFORSID 2019), Jun 2019, Paris, France. pp.239-254

    Accès: https://hal.archives-ouvertes.fr/hal-02891687

  • Xavier Baril, Oihana Coustié, Josiane Mothe, Olivier Teste

    RFreeStem: A multilanguage rule-free stemmer

    37e Congres Informatique des Organisations et Systemes d’Information et de Decision (INFORSID 2019), Jun 2019, Paris, France. pp.12-29

    Accès: https://hal.archives-ouvertes.fr/hal-02891675

  • Raphaëlle Bour, Nathalie Vallès-Parlangeau, Chantal Soulé-Dupuy

    DEMOS : une méthode de conception participative pour un empowerment démocratique des utilisateurs de SI

    37eme Congres Informatique des Organisations et Systemes d’Information et de Decision (INFORSID 2019), Jun 2019, Paris, France. pp.98-113

    Accès: https://hal.archives-ouvertes.fr/hal-02419422

  • Gabriel Ferrettini, Julien Aligon, Chantal Soulé-Dupuy

    Un cadre d’aide à l’exploitation des résultats de prédictions, à destination d’experts de domaine

    37eme Congres Informatique des Organisations et Systemes d’Information et de Decision (INFORSID 2019), Jun 2019, Paris, France. pp.206-220

    Accès: https://hal.archives-ouvertes.fr/hal-02419427

  • Nabil El Malki, Franck Ravat, Olivier Teste

    K-means improvement by dynamic pre-aggregates

    21st International Conference on Enterprise Information Systems (ICEIS 2019), May 2019, Heraklion, Crete, Greece. pp.133-140

    Accès: https://hal.archives-ouvertes.fr/hal-02493880

  • Livres (monographies)
  • Antonia Azzini, Sylvio Barbon Jr., Valerio Bellandi, Tiziana Catarci, Paolo Ceravolo, Philippe Cudre-Mauroux, Samira Maghool, Jaroslav Pokorný, Monica Scannapieco, Florence Sèdes, Gabriel marques Tavares, Robert Wrembel

    Advances in Data Management in the Big Data Era

    Advancing Research in Information and Communication Technology, AICT – 600, IFIP : International Federation for Information Processing, pp.99-126, 2021, IFIP Advances in Information and Communication Technology book series (IFIPAICT), 978-3-030-81700-8. ⟨10.1007/978-3-030-81701-5_4⟩

    Accès: https://hal.inria.fr/hal-03325984

  • Mariam Masmoudi, Wafa Abdelghani, Ikram Amous, Florence Sèdes

    Deep Learning for Trust-Related Attacks Detection in Social Internet of Things

    Proceedings of ICEBE 2019: Advances in E-Business Engineering for Ubiquitous Computing, 41, Springer, pp.389-404, 2020, Lecture Notes on Data Engineering and Communications Technologies book series (LNDECT), ⟨10.1007/978-3-030-34986-8_28⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03184004

  • Josiane Mothe, Thi Bich Ngoc Hoang

    Proceedings of the Workshop on Machine Learning for Trend and Weak Signal Detection in Social Networks and Social Media 2020

    CEUR-WS. Workshop on Machine Learning for Trend and Weak Signal Detection in Social Networks and Social Media 2020, Feb 2020, Toulouse, France. 2606, 2020

    Accès: https://hal.archives-ouvertes.fr/hal-02887432

  • Nathalie Aussenac-Gilles, Lynda Tamine, Nathalie Bricon-Souf

    Information médicale : représentation et traitement

    Aussenac-Gilles, Nathalie; Tamine, Lynda; Souf, Nathalie. Hermès Science, 37 (1-6), 2020, Technique et Science Informatiques : Revue des sciences et technologies de l’information

    Accès: https://hal.archives-ouvertes.fr/hal-03001569

  • Josiane Mothe, Iván Cantador, Max Chevalier, Massimo Melucci

    Proceedings of CIRCLE 2020 – Conference of the Information Retrieval Communities in Europe

    CEUR-WS. CIRCLE 2020, Jul 2020, Samatan, France. 2621, 2020

    Accès: https://hal.archives-ouvertes.fr/hal-02887476

  • Jérôme Darmont, Natalia Grabar, Olivier Teste

    Variété des masses de données en SHS

    Vincent Claveau (IRISA, CNRS); Jérome Darmont (ERIC, Univ. Lyon); Natalia Grabar (CNRS – STL, Lille); Olivier Teste (IRIT, Univ. Toulouse). Recherche d’Information, Document et Web Sémantique, 19 (1), ISTE Open Science; ISTE OpenScience, 2019

    Accès: https://hal.archives-ouvertes.fr/hal-02402828

  • Rita Zgheib, Emmanuel Conchon, Rémi Bastide

    Semantic Middleware Architectures for IoT Healthcare Applications

    Lecture Notes in Computer Science, 11369, Springer, Cham, pp.263–294, 2019, Enhanced Living Environments, 978-3-030-10751-2. ⟨10.1007/978-3-030-10752-9_11⟩

    Accès: https://hal-unilim.archives-ouvertes.fr/hal-02383462

  • Jian-Yun Nie, Max Chevalier

    Réseaux Sociaux et diffusion d’informations

    Nie, Jian-Yun; Chevalier, Max. Lavoisier, 21 (3_Septembre-Décembre 2018), 106 p., 2019, Revue des Sciences et Technologies de l’Information, série Document Numérique, 978-2-7462-4888-5

    Accès: https://hal.archives-ouvertes.fr/hal-03003822

  • Josiane Mothe, Peggy Cellier, Anne-Laure Ligozat

    COnférence en Recherche d’Informations et Applications – CORIA 2018, Rennes, France, 16/05/2018 – 18/05/2018

    Mothe; Josiane and Cellier; Peggy and Ligozat; Anne-Laure. May 2018, Rennes, France. ARIA : Association Francophone de Recherche d’Information et Applications, 2019

    Accès: https://hal.archives-ouvertes.fr/hal-03003818

  • Hamdi Ben Hamadou, Faiza Ghozzi, André Péninou, Olivier Teste

    Schema-Independent Querying and Manipulation for Heterogeneous Collections in NoSQL Document Stores

    Hammoudi; Slimane and Smialek; Michal and Camp; Olivier and Filipe; Joaquim. ICEIS 2018: International Conference on Enterprise Information Systems, 363, Springer, pp.324–349, 2019, Lecture Notes in Business Information Processing book series (LNBIP), ⟨10.1007/978-3-030-26169-6_16⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03012556

  • Thèses et habilitations
  • Inès Ben Kraiem

    Détection d’Anomalies Multiples par Apprentissage Automatique de Règles dans les Séries Temporelles

    Intelligence artificielle [cs.AI]. Université de Toulouse-Jean Jaurès, 2021. Français

    Accès: https://hal.archives-ouvertes.fr/tel-03137163

  • Nabil El Malki

    New Partition-based and Density-based approaches for improving clustering

    Computer Science [cs]. Université Toulouse – Jean Jaurès, 2021. English

    Accès: https://hal.archives-ouvertes.fr/tel-03188515

  • Iarivony Ramiandrisoa

    Extraction et fouille de données textuelles : application à la détection de la dépression, de l’anorexie et de l’agressivité dans les réseaux sociaux

    Ordinateur et société [cs.CY]. Université Paul Sabatier – Toulouse III; Université d’Antananarivo, 2020. Français. ⟨NNT : 2020TOU30191⟩

    Accès: https://tel.archives-ouvertes.fr/tel-03170574

  • Wafa Abdelghani

    A multi-dimensional trust-model for dynamic, scalable and resources-efficient trust-management in social internet of things

    Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III; Université de Sfax (Tunisie), 2020. English. ⟨NNT : 2020TOU30231⟩

    Accès: https://tel.archives-ouvertes.fr/tel-03215718

  • Franck Jeveme Panta

    Modélisation des métadonnées multi sources et hétérogènes pour le filtrage négatif et l’interrogation intelligente de grands volumes de données : application à la vidéosurveillance

    Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2020. Français. ⟨NNT : 2020TOU30098⟩

    Accès: https://tel.archives-ouvertes.fr/tel-03118294

  • Mahmoud Qodseya

    Managing heterogeneous cues in social contexts : A holistic approach for social interactions analysis

    Computers and Society [cs.CY]. Université Paul Sabatier – Toulouse III, 2020. English. ⟨NNT : 2020TOU30099⟩

    Accès: https://tel.archives-ouvertes.fr/tel-03118308

  • Raphaëlle Bour

    DEMOS : une méthode de conception participative de systèmes d’information soutenant la démocratie des organisations

    Informatique [cs]. Université Toulouse 1 Capitole, 2019. Français

    Accès: https://hal.archives-ouvertes.fr/tel-02493752

  • Hamdi Ben Hamadou

    Querying heterogeneous data in NoSQL document stores

    Databases [cs.DB]. Université Paul Sabatier – Toulouse III, 2019. English. ⟨NNT : 2019TOU30146⟩

    Accès: https://tel.archives-ouvertes.fr/tel-03163663v2

  • Amir Laadhar

    Local matching learning of large scale biomedical ontologies

    Technology for Human Learning. Université Paul Sabatier – Toulouse III, 2019. English. ⟨NNT : 2019TOU30126⟩

    Accès: https://tel.archives-ouvertes.fr/tel-02651332

  • Thi Bich Ngoc Hoang

    Information diffusion, information and knowledge extraction from social networks

    Information Retrieval [cs.IR]. Université Toulouse le Mirail – Toulouse II, 2018. English. ⟨NNT : 2018TOU20078⟩

    Accès: https://tel.archives-ouvertes.fr/tel-02460788

  • Rapports
  • Tinyuan Liu

    Modélisation et Implantation de documents RDF

    [Rapport de recherche] Université des Sciences Sociales. 2018

    Accès: https://hal.archives-ouvertes.fr/hal-02983161

  • Mamitiana Ignace Randrianarivony

    Détection de concepts et annotation automatique d’images médicales par apprentissage profond

    [Rapport de recherche] Université d’Antananarivo. 2018

    Accès: https://hal.archives-ouvertes.fr/hal-02982593

  • William Raynaut, Chantal Soulé-Dupuy, Nathalie Vallès-Parlangeau

    Dissimilarités entre jeux de données

    [Rapport de recherche] RR–2017–07–FR, IRIT. 2017

    Accès: https://hal.archives-ouvertes.fr/hal-01501485

  • Ambinintsoa Jocelyn Rakotonirina

    Filtrage Collaboratif Sensible au Contexte : une approche basée sur LDA

    [Rapport de recherche] Université d’Antananarivo; IRIT : Institut en Recherche Informatique de Toulouse, France. 2017

    Accès: https://hal.archives-ouvertes.fr/hal-03128321

  • Jiayi Liu

    Intégration de données relationnelles et de données liées dans le système de stockage NoSQL orientés-graphes Neo4J

    [Rapport de recherche] Université des Sciences Sociales. 2017

    Accès: https://hal.archives-ouvertes.fr/hal-03131864

  • Inès Ben Kraiem

    Modélisation et intégration de données de capteurs/compteurs du SGE

    [Rapport de recherche] IRIT. 2017

    Accès: https://hal.archives-ouvertes.fr/hal-03131871

  • Rapports

    contrats de l’équipe

    AcronymeTitreResp. scDébut – fin
    BI4People autre Le décisionnel pour tou.t.es Franck RAVAT
    2019 – 2023
    FILTER 2
    [Contrat terminé]
    anr Filtrage négatif des contenus de vidéo protection Florence SèDES
    2016 – 2020
    ARCSYS
    [Contrat terminé]
    Accés et recollection dans les systèmes d’information complexes Max CHEVALIER
    2013 – 2015
    INCOME
    [Contrat terminé]
    autre Infrastructure logicielle de gestion de contexte multi-échelle pour l’internet des objets Jean-Paul ARCANGELI
    Thierry DESPRATS
    André PéNINOU
    2012 – 2015
    METHODEO
    [Contrat terminé]
    Méthodologie de tests et définition de métriques poour l’évaluation d’alogorithmes pour la vidéoprotection Florence SèDES
    2011 – 2013
    CAAS
    [Contrat terminé]
    autre Contextual Analysis and Adaptative Search Josiane MOTHE
    2010 – 2014
    AcronymeTitreResp. scDébut – fin
    EFFECTOR auropa An End to end Interoperability Framework For MaritimE Situational Awareness at StrategiC and TacTical OpeRations Ronan TOURNIER
    2020 – 2022
    InnEOSpace_PhD Open Science Innovation in PhD programme through Earth Observation: towards new career skills development Josiane MOTHE
    2020 – 2023
    PREVISION
    [Contrat terminé]
    auropa Prediction and Visual Intelligence for Security Information Josiane MOTHE
    2019 – 2021
    FabSpace 2.0
    [Contrat terminé]
    The Fablab for geodata-driven innovation – by leveraging Space data in particular, in Universities 2.0 Josiane MOTHE
    2016 – 2019
    AcronymeTitreResp. scDébut – fin
    2019-420 Qualification des données et des biais – Application aux systèmes décisionnels en santé Imen MEGDICHE-BOUSARSAR
    2019 – 2024
    PRESTON Prévention en santé au travail et outils numériques Rémi BASTIDE
    2020 – 2023
    NURISENS
    [Contrat terminé]
    NURISENS André PéNINOU
    2019 – 2021
    FADA
    [Contrat terminé]
    Food in the Age of Data : de l’apport de la science des données à l’étude des comportements alimentaires et de la nutrition Florence SèDES
    2016 – 2020
    ModelAge
    [Contrat terminé]
    ModelAge – Vers un environnement logiciel d’aide à la simulation pour la prédiction des pathologies associées à l’âge Chantal SOULé-DUPUY
    2014 – 2018
    DEMETER
    [Contrat terminé]
    DEMETER Région Midi-Pyrénées Jean-Pierre JESSEL
    Florence SèDES
    2012 – 2013

    [Contrat terminé]
    NOMAO année 2 Josiane MOTHE
    2011 – 2013

    [Contrat terminé]
    NOMAO Année 2 Investissement Josiane MOTHE
    2011 – 2013
    Logs
    [Contrat terminé]
    Evaluation du moteur de recherche et de recommandation Nomao par l’analyse de journaux Josiane MOTHE
    2010 – 2012
    NOMAO
    [Contrat terminé]
    Textmining pour les réseaux sémantiques et les réseaux sociaux Josiane MOTHE
    2010 – 2013

    [Contrat terminé]
    Textmining pour les réseaux sémantiques et les réseaux sociaux Josiane MOTHE
    2010 – 2014
    Lundi 20 Septembre 2021, 9h00
    Class Distribution Influence and Evaluation in Deep Learning – Application to Cancer Detection on Histological Images
    Ismat Ara RESHMA – Equipe REVA, Equipe SIG, IRIT UT3 Paul Sabatier, IRIT, Salle des Thèses
    #these
    Lundi 20 Septembre 2021, 9h00
    Class Distribution Influence and Evaluation in Deep Learning – Application to Cancer Detection on Histological Images
    Ismat Ara RESHMA – Equipe REVA, Equipe SIG, IRIT UT3 Paul Sabatier, IRIT, Salle des Thèses
    #these
    Mardi 11 Mai 2021, 10h00
    Détection d’anomalies dans les systèmes d’information modernes grâce à des méthodes d’inférence de structure et de détection de nouveautés dans les logs
    Oihana COUSTIÉ – Equipe SIG, IRIT UT3 Paul Sabatier, IRIT, Salle des Thèses et en visioconférence
    #these
    Jeudi 6 Mai 2021, 14h00
    Données fonctionnelles multivariées : Extraction de caractéristiques géométriques et apprentissage parcimonieux de la dynamique
    Clément LEJEUNE – Equipe SIG, IRIT UT3 Paul Sabatier, En visioconférence
    #these
    Vendredi 29 Janvier 2021, 15h00
    Détection d’Anomalies Multiples par Apprentissage Automatique de Règles dans les Séries Temporelles
    Inès BEN KRAIEM – Equipe SIG, IRIT UT2 Jean Jaurès, IRIT, Salle des Thèses et en visioconférence
    #these
    Mercredi 13 Janvier 2021, 9h30
    New partition-based and density-based approaches for improving clustering
    Nabil EL MALKI – Equipe SIG, IRIT UT3 Paul Sabatier, IRIT, Salle 001 et en visioconférence
    #these
    Lundi 14 Décembre 2020, 10h00
    Extraction et fouille de données textuelles: application à la détection de la dépression, de l’anorexie et de l’agressivité dans les réseaux sociaux
    Faneva RAMIANDRISOA – Equipe SIG, IRIT UT3 Paul Sabatier, IRIT, salle des thèses et en visioconférence
    #these
    Mardi 8 Décembre 2020, 14h00
    A Multi-Dimensional Trust-Model for Dynamic, Scalable and Resources-efficient Trust-Management in Social Internet of Things
    Wafa ABDELGHANI – Equipe SIG, IRIT UT3 Paul Sabatier, IRIT, salle des thèses et en visioconférence
    #these
    Mercredi 7 Octobre 2020, 9h30
    Modélisation des métadonnées multi sources et hétérogènes pour le filtrage négatif et l’interrogation intelligente de grands volumes de données : application à la vidéosurveillance
    Franck JEVEME PANTA – Equipe SIG, IRIT UT3 Paul Sabatier, IRIT, salle 001 et en visioconférence
    #these
    Lundi 5 Octobre 2020, 13h30
    Gérer des Descripteurs Hétérogènes dans des Contextes Sociaux – Une Approche Holistique pour l’Analyse des Interactions Sociales
    Mahmoud F.T. QODSEYA – Equipe SIG, IRIT UT3 Paul Sabatier, IRIT, salle 001 et en visioconférence
    #these
    Vendredi 20 Décembre 2019, 10h30
    Apprentissage profond sur des données médicales multi-variées
    Sonia MEJBRI – Equipe SIG, Equipe REVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Mardi 7 Juillet 2020 – Jeudi 9 Juillet 2020
    CONFÉRENCE VIRTUELLE CIRCLE 2020 | Joint Conference of the Information Retrieval Communities in Europe
    En visioconférence
    #congres En savoir plus
    Jeudi 27 Février 2020 – Vendredi 28 Février 2020
    Workshop on Machine Learning for Trend and Weak Signal Detection in Social Networks and Social Media
    INSPE St-Agne, Toulouse
    #congres En savoir plus
    Dimanche 21 Juillet 2019 – Jeudi 25 Juillet 2019
    SIGIR 2019 : 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval
    Paris
    #congres En savoir plus
    Mardi 6 Novembre 2018 – Vendredi 9 Novembre 2018
    SAGEO 2018 : Spatial Analysis and GEOmatics
    Montpellier
    #congres En savoir plus
    Jeudi 21 Juin 2018 – Vendredi 22 Juin 2018
    VSST 2018 : Séminaire international Veille Stratégique Scientifique et Technologique
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #congres En savoir plus
    Lundi 16 Octobre 2017
    Colloque SIF : Casser les codes — Femmes, genre et informatique
    Institut des sciences de la communication – CNRS/Paris-Sorbonne/UPMC, Paris
    #congres En savoir plus
    Jeudi 1 Juin 2017
    Dans le cadre d’INFORSID 2017 : Atelier Systèmes d’information et de décision et Démocratie
    Manufacture des Tabacs, salle MD001
    #congres En savoir plus
    Mercredi 31 Mai 2017
    Dans le cadre d’INFORSID 2017 : Atelier Valorisation et Analyse des DOnnées de la Recherche (VADOR)
    Manufacture des Tabacs
    #congres En savoir plus
    Mardi 30 Mai 2017 – Vendredi 2 Juin 2017
    35e édition d’INFormatique des ORganisations et Systèmes d’Information et de Décision (INFORSID 2017)
    Manufacture des Tabacs
    #congres En savoir plus
    Mardi 30 Mai 2017
    Dans le cadre d’INFORSID 2017 : Atelier De la surveillance à la gestion de crise : prise en compte des alertes
    Manufacture des Tabacs, salle MH001
    #congres En savoir plus
    Vendredi 5 Juillet 2019, 15h20 – 16h00
    A theory of information perspective on hyperspectral images
    Mihai IVANOVICI – Transilvania University of Brasov (Roumanie) UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Jeudi 7 Février 2019, 11h00 – 12h00
    Usage patterns of non-native language speakers discovered by string kernels for native language identification
    Radu TUDOR IONESCU – University of Bucharest (Roumanie) UT3 Paul Sabatier, IRIT, Salle du Conseil
    #seminaire
    Mercredi 6 Février 2019, 14h00 – 15h30
    Machine learning for anomaly detection in Video
    Radu TUDOR IONESCU – University of Bucharest (Roumanie) UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #seminaire
    Lundi 19 Novembre 2018, 14h00 – 15h00
    Information Theory
    Mariam HARUTYUNYAN – Institute for Informatics and Automation Problems of National Academy of Sciences of Armenia (IIAP NAS RA) (Arménie) UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #seminaire
    Mercredi 18 Juillet 2018, 14h00 – 15h00
    The Evolution of Belief Rule Based Expert Systems: A New Paradigm of Computing
    Mohammad SHAHADAT HOSSAIN – Dpt of Computer Science and Engineering, University of Chittagong (Bengladesh) UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Vendredi 6 Juillet 2018, 11h00 – 12h00
    Non-linear approaches based on the maximum distance — a pseudo morphology and PCA approximation for color, multispectral and hyperspectral data/image analysis
    Mihai IVANOVICI – Transilvania University of Brasov (Roumanie) UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #seminaire
    Vendredi 9 Février 2018, 11h00 – 12h00
    Thematic Semeste on Mathematic and Computer Science in Biology: Computational biophotonics and surgical data science for next-generation cancer treatment
    Prof. Dr. Lena MAIER-HEIN – Div. Computer Assisted Medical Interventions (CAMI) German Cancer Research Center (DKFZ) (Allemagne) UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #seminaire
    Vendredi 9 Février 2018, 8h45 – 9h45
    Thematic Semester on Mathematic and Computer Science in Biology: Opportunities and challenges of using clinical data, including that from the electronic health record
    William R. HERSH – Oregon Health & Science University (OHSU) (Etats-Unis) UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #seminaire
    Mardi 16 Mai 2017, 12h30 – 14h00
    Mon téléphone n’est plus une brique quand je veux écrire
    Philippe ROUSSILLE – Equipe SIG – IRIT (France) UT1 Capitole, Manufacture des Tabacs, Salle ME302
    #seminaire
    Lundi 7 Novembre 2016, 14h00 – 16h00
    A Test Collection for Research on Depression and Language Use
    Fabio CRESTANI – Faculty of Informatics, University of Lugano (Suisse) UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #seminaire
    Mardi 10 Septembre 2019
    Journée Ingénierie des Exigences du GDR GPL – JET 2019 – JET 2019
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee
    Lundi 1 Octobre 2018
    JET 2018 : Journée ingénierie des Exigences à Toulouse
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee
    Mardi 30 Mai 2017
    Dans le cadre d’INFORSID 2017 : Atelier Open et/ou Linked Data dans les systèmes d’information
    UT1 Capitole, Manufacture des tabacs – Hall Bât E – salle MH003
    #journee
    Lundi 16 Novembre 2015 – Mardi 17 Novembre 2015
    Journées Big Data des GDR MADICS et MascotNUM – Trimestre thématique du LabEx CIMI
    UT3 Paul Sabatier, IMT, Amphithéâtre Schwartz – Bât U4, Amphithéâtre Concorde
    #journee