IRIS Team

Head : Gilles HUBERT

The IRIS team conducts research activities to define Information Retrieval (IR) models that address multiple issues. The team is particularly interested in complex information retrieval where it is necessary to consider different elements depending on the context in which the search is conducted (i.e., contextual IR).

The IRIS team is also working on the development of value-added information. In particular, it defines models for building information that meets a given need by aggregating relevant information nuggets from different heterogeneous sources, such as the Web or scientific publications. The representation of data in the form of networks, often dynamic, appears natural in many cases: social networks, word networks, social networks, the Web. It is in this context that the IRIS team is interested in the mining of dynamic graphs to better understand or predict the relationships between entities.

The IRIS team also conducts research in bibliometrics and more generally in scientometrics.

This research is multidisciplinary and conducted in collaboration with researchers from disciplines such as sociology, psychology, pharmacology or biology. The IT issues to which the team responds are thus enriched by issues from multiple disciplines, thus opening up new lines of research.

The work of the IRIS team is naturally in line with current issues related to Data Science.

skills

Information retrieval
Information synthesis
Scientometry
Social media analysis
Text mining
Deep learning

Members team

Permanent members
Non-permanent members
External members

publications team

International journals articles
  • Lila Boualili, José G. Moreno, Mohand Boughanem

    Highlighting exact matching via marking strategies for ad hoc document ranking with pretrained contextualized language models

    Information Retrieval Journal, 2022, 25 (4), pp.414-460. ⟨10.1007/s10791-022-09414-x⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03881847

  • Matteo Lascialfari, Marie-Benoît Magrini, Guillaume Cabanac

    Unpacking research lock-in through a diachronic analysis of topic cluster trajectories in scholarly publications

    Scientometrics, 2022, 127 (11), pp.6265-6189. ⟨10.1007/s11192-022-04514-3⟩

    Accès: https://hal.inrae.fr/hal-03791799

  • Marie-Benoît Magrini, Tristan Salord, Guillaume Cabanac

    The unbalanced development among legume species regarding sustainable and healthy agrifood systems in North-America and Europe: focus on food product innovations

    Food Security, 2022, 14 p. ⟨10.1007/s12571-022-01294-9⟩

    Accès: https://hal.inrae.fr/hal-03762801

  • Fabio Espichán, Rosario Rojas, Fredy Quispe, Guillaume Cabanac, Guillaume Marti

    Metabolomic characterization of 5 native Peruvian chili peppers (Capsicum spp.) as a tool for species discrimination

    Food Chemistry, 2022, 386, pp.132704. ⟨10.1016/j.foodchem.2022.132704⟩

    Accès: https://ut3-toulouseinp.hal.science/hal-03622192

  • Elvys Linhares Pontes, Luis Adrián Cabrera-Diego, Jose G Moreno, Emanuela Boros, Ahmed Hamdi, Antoine Doucet, Nicolas Sidère, Mickaël Coustaty

    MELHISSA: a multilingual entity linking architecture for historical press articles

    International Journal on Digital Libraries, 2022, 23 (2), pp.133-160. ⟨10.1007/s00799-021-00319-6⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03885133

  • Tristan Salord, Marie-Benoît Magrini, Guillaume Cabanac

    Packaged foods with pulse ingredients in Europe: A dataset of text-mined product formulations

    Data in Brief, 2022, 42, ⟨10.1016/j.dib.2022.108173⟩

    Accès: https://hal.inrae.fr/hal-03693009

  • Yasunori Park, Rachael West, Pranujan Pathmendra, Bertrand Favier, Thomas Stoeger, Amanda Capes-Davis, Guillaume Cabanac, Cyril Labbé, Jennifer Byrne

    Identification of human gene research articles with wrongly identified nucleotide sequences

    Life Science Alliance, 2022, 5 (4), pp.e202101203. ⟨10.26508/lsa.202101203⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03523959

  • Heusse M.-D., Guillaume Cabanac

    ORCID growth and field‐wise dynamics of adoption: A case study of the Toulouse scientific area

    Learned Publishing, 2022, 35 (4), pp.454-466. ⟨10.1002/leap.1451⟩

    Accès: https://ut3-toulouseinp.hal.science/hal-03606724

  • Héloïse Prévost, Julien Figeac, Tristan Salord, Guillaume Cabanac

    Internet dans la reconfiguration des répertoires d’action du mouvement “féministe agroécologique” brésilien

    Politiques de communication, 2021, 17, pp.129-156. ⟨10.3917/pdc.017.0129⟩

    Accès: https://shs.hal.science/halshs-03658292

  • Guillaume Cabanac

    This digital-hygiene routine will protect your scholarship

    Nature, 2021, 598 (7882), pp.541. ⟨10.1038/d41586-021-02901-z⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03404669

  • National journals articles
  • Nathalie Aussenac-Gilles, Nathalie Souf, Lynda Tamine

    Introduction

    Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, 2018, Information médicale : représentation et traitement, 37 (1-6), pp.7-9. ⟨10.3166/tsi37-0006⟩

    Accès: https://hal.archives-ouvertes.fr/hal-02924569

  • Thomas Palmer, Gilles Hubert, Karen Pinel-Sauvagnat

    Retweeter ou ne pas retweeter

    Document numérique – Revue des sciences et technologies de l’information. Série Document numérique, 2018, 21 (3), pp.81-103. ⟨10.3166/DN.21.3.81-103⟩

    Accès: https://hal.archives-ouvertes.fr/hal-02064611

  • Cécile Favre, Chloé Artaud, Clément Duffau, Ophélie Fraisier, Roland Kotto-Kombi

    Forum Jeunes Chercheurs à Inforsid 2016

    Revue des Sciences et Technologies de l’Information – Série ISI : Ingénierie des Systèmes d’Information, 2017, 22 (2), pp.121-147

    Accès: https://hal.archives-ouvertes.fr/hal-01914115

  • National journals articles
    International conferences articles
    National conferences articles
  • Emanuela Boros, Jose Moreno, Antoine Doucet

    L’importance des entités pour la tâche de détection d’événements en tant que système de question-réponse

    Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.374-383

    Accès: https://hal.archives-ouvertes.fr/hal-03701488

  • Marie-Benoît Magrini, Tristan Salord, Guillaume Cabanac

    Caractériser la performance des trajectoires scientifiques sous le prisme des sources de financement de la recherche

    Journée d’études : L’argent de la science (2021), INRAE, Jun 2021, Toulouse (visoconférence), France. pp.1-7

    Accès: https://hal.inrae.fr/hal-03261154

  • Emanuela Boros, Ahmed Hamdi, Elvys Linhares Pontes, Luis Adrián Cabrera-Diego, José G. Moreno, Nicolas Sidere, Antoine Doucet

    Atténuer les erreurs de numérisation dans la reconnaissance d’entités nommées pour les documents historiques

    Conférence en Recherche d’Informations et Applications (CORIA 2021), ARIA : Association Francophone de Recherche d’Information (RI) et Applications, Apr 2021, Grenoble (virtuel), France. pp.1 – 7, ⟨10.24348/coria.2021.mini_24⟩

    Accès: https://hal.archives-ouvertes.fr/hal-03320332

  • Paul Mousset, Yoann Pitarch, Lynda Tamine

    Régularisation spatiale de représentations distribuées de mots

    16e Conférence francophone en Recherche d’Information et Applications (CORIA 2019), Apr 2019, Lyon, France. pp.1-17

    Accès: https://hal.archives-ouvertes.fr/hal-02494102

  • Thiziri Belkacem, Taoufiq Dkaki, José G. Moreno, Mohand Boughanem

    aMV-LSTM: an attention-based model with multiple positional text matching

    34th ACM/SIGAPP Symposium on Applied Computing (SAC 2019), Apr 2019, Limassol, Cyprus. pp.788-795

    Accès: https://hal.archives-ouvertes.fr/hal-02441990

  • Gilles Hubert, Yoann Pitarch, Karen Pinel-Sauvagnat, Ronan Tournier, Léa Laporte

    TournaRank : Quand la recherche d’information devient un tournoi entre documents

    15e Conference francophone en Recherche d’Information et Applications (CORIA 2018), May 2018, Rennes, France. pp.1-16

    Accès: https://hal.archives-ouvertes.fr/hal-02305352

  • Thiziri Belkacem, Taoufiq Dkaki, José G. Moreno, Mohand Boughanem

    Impact de la présence/absence des termes de la requête dans le document sur le processus d’appariement document-requête en utilisant Word2Vec

    15e Conference francophone en Recherche d’Information et Applications (CORIA 2018), May 2018, Rennes, France. pp.1-16

    Accès: https://hal.archives-ouvertes.fr/hal-02305347

  • Gia-Hung Nguyen, Lynda Tamine, Laure Soulier, Nathalie Souf

    Apprentissage de représentation des documents médicaux guidé par les concepts pour la recherche d’information

    4e Symposium sur l’Ingénierie de l’Information Médicale (SIIM 2017), Nov 2017, Toulouse, France. pp.1-8

    Accès: https://hal.archives-ouvertes.fr/hal-02316857

  • Abdelhamid Chellal, Mohand Boughanem

    IRIT at TREC Real-Time Summarization 2017

    Text REtrieval Conference (TREC 2017), Nov 2017, Maryland, United States. pp.1

    Accès: https://hal.archives-ouvertes.fr/hal-02871301

  • Ophélie Fraisier, Guillaume Cabanac, Yoann Pitarch, Romaric Besancon, Mohand Boughanem

    Détection de points de vue à l’aide des proximités inter-profils

    Conférence sur les Modèles et l’Analyse des Réseaux : Approches Mathématiques et Informatique (MARAMI), Oct 2017, La Rochelle, France. pp.0

    Accès: https://hal.archives-ouvertes.fr/hal-02611652

  • Thesis and HDR
  • Luis Eduardo Lugo Martinez

    Modelling patterns of search behaviours from user interactions

    Information Retrieval [cs.IR]. Université Paul Sabatier – Toulouse III, 2021. English. ⟨NNT : 2021TOU30196⟩

    Accès: https://theses.hal.science/tel-03667342

  • Paul Mousset

    Modèles neuronaux pour la représentation et l’appariement d’objets géotextuels

    Interface homme-machine [cs.HC]. Université Paul Sabatier – Toulouse III, 2020. Français. ⟨NNT : 2020TOU30042⟩

    Accès: https://theses.hal.science/tel-02979573

  • Thiziri Belkacem

    Neural models for information retrieval : towards asymmetry sensitive approaches based on attention models

    Information Retrieval [cs.IR]. Université Paul Sabatier – Toulouse III, 2019. English. ⟨NNT : 2019TOU30167⟩

    Accès: https://theses.hal.science/tel-02499432

  • Gia-Hung Nguyen

    Modèles neuronaux pour la recherche d’information : approches dirigées par les ressources sémantiques

    Informatique et langage [cs.CL]. Université Paul Sabatier – Toulouse III, 2018. Français. ⟨NNT : 2018TOU30233⟩

    Accès: https://theses.hal.science/tel-02507902

  • Ophélie Fraisier

    Détection des points de vue sur les médias sociaux numériques

    Informatique [cs]. Université Paul Sabatier – Toulouse III, 2018. Français. ⟨NNT : 2018TOU30200⟩

    Accès: https://theses.hal.science/tel-02288853v2

  • Abdelhamid Chellal

    Event summarization on social media stream : retrospective and prospective tweet summarization

    Information Retrieval [cs.IR]. Université Paul Sabatier – Toulouse III, 2018. English. ⟨NNT : 2018TOU30118⟩

    Accès: https://theses.hal.science/tel-02276764

  • Karen Pinel-Sauvagnat

    De la recherche de granules documentaires à l’agrégation d’information

    Recherche d’information [cs.IR]. Université Paul Sabatier (Toulouse 3), 2018

    Accès: https://theses.hal.science/tel-01865051v2

  • Hong Diep Tran

    Modélisation d’expertise scientifique pour la constitution de comités de programme

    Recherche d’information [cs.IR]. Université Paul Sabatier – Toulouse III, 2017. Français. ⟨NNT : 2017TOU30233⟩

    Accès: https://theses.hal.science/tel-01671704v2

  • Thibaut Thonet

    Modèles thématiques pour la découverte non supervisée de points de vue sur le Web

    Web. Université Paul Sabatier – Toulouse III, 2017. Français. ⟨NNT : 2017TOU30167⟩

    Accès: https://theses.hal.science/tel-01655278v2

  • Ameni Kacem

    Personalized information retrieval based on time-sensitive user profile

    Information Retrieval [cs.IR]. Université Paul Sabatier – Toulouse III, 2017. English. ⟨NNT : 2017TOU30111⟩

    Accès: https://theses.hal.science/tel-01707423v3

  • Reports
  • Guillaume Cabanac

    Decontamination of the scientific literature

    Institut Universitaire de France. 2022

    Accès: https://ut3-toulouseinp.hal.science/hal-03835147

  • Jennifer Byrne, Yasunori Park, Amanda Capes-Davis, Bertrand Favier, Guillaume Cabanac, Cyril Labbé

    Seek & Blastn Standard Operating Procedure

    [Technical Report] Seek&Blastn Team. 2021

    Accès: https://hal.archives-ouvertes.fr/hal-03117303

  • Pascal Marchand, Brigitte Sebbah, Julie Renard, Guillaume Cabanac, Laurent Thiong-Kay, Natacha Souillard, Lucie Loubère

    « Vrai débat » : sortir du débat pour négocier

    [Rapport de recherche] Université de Toulouse. 2019

    Accès: https://hal.archives-ouvertes.fr/hal-02976611

  • Reports Other publications

    Contracts team

    AcronymeTitreResp. scDébut – fin
    CoST anr Modélisation de tâches complexes en recherche d’information Lynda TAMINE-LECHANI
    2018 – 2023
    MEERQAT anr Représentation multimédia d’entités et systèmes de question réponse José MORENO
    2020 – 2023
    LAWBOT anr Apprentissage profond pour la Modélisation prédictive de la jurisprudence Gilles HUBERT
    2021 – 2024
    CAIR
    [Contract completed]
    Recherche d’Information Agrégative Contextuelle Mohand BOUGHANEM
    2014 – 2018
    AcronymeTitreResp. scDébut – fin
    NanoBubbles Nano bubbles : how, when and why does sciences fail to correct itself ? Guillaume CABANAC
    2021 – 2026
    AcronymeTitreResp. scDébut – fin
    BioMedExplore Approche d’extraction et de recherche d’information pour l’exploration et l’analyse multi-facettes de corpus de publications scientifiques en Biomédecine Gilles HUBERT
    2021 – 2024
    KING Knowledge and INovation on Grain-legumeS food products Guillaume CABANAC
    2021 – 2023
    2014-302
    [Contract completed]
    Analyse d’opinions sur les réseaux sociaux Mohand BOUGHANEM
    2016 – 2019
    Sunday 2 April 2023
    BIR@ECIR2023 : 13th International Workshop on Bibliometric-enhanced Information Retrieval
    Dublin (Irlande)
    #journee
    Friday 16 December 2022, 10h00
    S’informer sur les médias sociaux via l’élaboration d’information synthétique
    Alexis DUSART – Team IRIS, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Thursday 8 December 2022, 10h00 – 11h30
    Ethics of Scientific Publication – Deficient Institutional Responses
    David SANDERS – Purdue University (Etats-Unis) UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Friday 16 December 2022, 10h00
    S’informer sur les médias sociaux via l’élaboration d’information synthétique
    Alexis DUSART – Team IRIS, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Friday 25 November 2022, 10h00
    Modèles neuronaux de recommandation basés sur les folksonomies
    Tahar-Rafik BOUDIBA – Team IRIS, IRIT UT3 Paul Sabatier, IRIT, Salle des Thèses
    #these
    Wednesday 23 November 2022, 10h00
    Deep Learning for Information Retrieval: Studying Relevant Signals for Ad-Hoc Search based on Transformer Models
    Lila BOUALILI – Team IRIS, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Wednesday 8 July 2020, 9h30
    xx
    Paul MOUSSET – Team IRIS, IRIT UT3 Paul Sabatier, En visioconférence
    #these
    Thursday 28 November 2019, 10h30
    Neural Models for Information Retrieval: Towards Asymmetry Sensitive Approaches Based on Attention Models
    Thiziri BELKACEM – Team IRIS, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Tuesday 18 December 2018, 14h00
    Modèles neuronaux pour la recherche d’information : approches dirigées par les ressources sémantiques
    Gia Hung NGUYEN – Team IRIS – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Friday 7 December 2018, 10h30
    Détection de points de vue sur les médias sociaux numériques
    Ophélie FRAISIER – Team IRIS – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Monday 17 September 2018, 10h00
    Synthèse d’événement dans les médias sociaux : résumé rétrospectif et prospectif de microblogs
    Abdelhamid CHELLAL – Team IRIS – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Tuesday 19 December 2017, 13h30
    Modélisation d’expertise scientifique pour la constitution de comités de programme
    Hong Diep TRAN – Team IRIS – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #these
    Thursday 23 November 2017, 13h30
    Modèles thématiques pour la découverte non supervisée de points de vue sur le Web
    Thibaut THONET – Team IRIS – IRIT UT3 Paul Sabatier, IRIT, Salle des Thèses
    #these
    Sunday 21 July 2019 – Thursday 25 July 2019
    SIGIR 2019 : 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval
    Paris
    #congres Know more
    Sunday 16 June 2019 – Wednesday 19 June 2019
    JADT 2020 : 15es Journées Internationales d’Analyse statistique des Données Textuelles
    UT2 Jean Jaurès, Maison de la Recherche
    #congres Know more
    Sunday 14 April 2019
    BIR 2019 : 8th International Workshop on Bibliometric-enhanced Information Retrieval
    Cologne (Allemagne)
    #congres Know more
    Monday 26 March 2018
    BIR 2018 : 7th International Workshop on Bibliometric-enhanced Information Retrieval (co-located ECIR 2018)
    Grenoble
    #congres Know more
    Wednesday 31 May 2017
    Dans le cadre d’INFORSID 2017 : Atelier Valorisation et Analyse des DOnnées de la Recherche (VADOR)
    Manufacture des Tabacs
    #congres Know more
    Thursday 8 December 2022, 10h00 – 11h30
    Ethics of Scientific Publication – Deficient Institutional Responses
    David SANDERS – Purdue University (Etats-Unis) UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Thursday 6 June 2019, 13h30 – 14h30
    Science communication through narratives: SciComm Narratives
    Aquiles NEGRETE YANKELEVICH – Professor of Science Communication, Universidad Nacional Autonoma de Mexico (UNAM) (Mexique) UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Wednesday 6 March 2019, 14h00 – 15h30
    Désambiguïsation et alignement d’entités géographiques dans les textes scientifiques
    Pascal CUXAC – INIST, Nancy UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #seminaire
    Tuesday 27 November 2018, 13h30 – 14h30
    Trends in Gaming Indicators: On Failed Attempts at Deception and their Computerised Detection
    Cyril LABBÉ – Université Grenoble Alpes UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Friday 12 October 2018, 14h00 – 15h00
    Matrix Factorization Methods for Multimodal Retrieval
    Juan Carlos CAICEDO – Broad Institute of MIT and Harvard (Etats-Unis) UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Friday 13 April 2018, 15h00 – 16h00
    Séminaire « Savoirs, Réseaux, Médiations » (SRM) : Auteurs et collectifs de fanfictions sur internet
    Aurore DERAMOND – LISST-CERS, Université de Toulouse UT3 Paul Sabatier, IRIT, Salle 001
    #seminaire
    Friday 13 April 2018, 14h00 – 15h00
    Séminaire « Savoirs, Réseaux, Médiations » (SRM) : Découverte de points de vue sur les media sociaux
    Ophélie FRAISIER – Team IRIS – IRIT (France) UT3 Paul Sabatier, IRIT, Salle 001
    #seminaire
    Wednesday 29 November 2017, 14h00 – 16h00
    From perceptrons to Alpha Go and beyond: An overview of Deep Learning
    Dennis WILSON – Team VORTEX – IRIT (France) UT3 Paul Sabatier, IRIT, Salle du Conseil
    #seminaire
    Wednesday 26 April 2017, 14h00 – 15h30
    Analyzing citations in context: challenges and opportunities
    Cassidy R. SUGIMOTO – Indiana University Bloomington (Etats-Unis) UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Friday 25 November 2016, 11h00 – 12h30
    Structure spatiale et temporelle des références bibliographiques
    Marc BERTIN – LERASS (France) UT3 Paul Sabatier, IRIT, Salle des Thèses
    #seminaire
    Friday 13 July 2018, 10h30
    De la recherche de granules documentaires à l’agrégation d’information
    Karen PINEL-SAUVAGNAT – Team IRIS – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #hdr
    Thursday 8 December 2016, 10h00
    Interroger le texte scientifique
    Guillaume CABANAC – Team IRIS – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #hdr
    Sunday 2 April 2023
    BIR@ECIR2023 : 13th International Workshop on Bibliometric-enhanced Information Retrieval
    Dublin (Irlande)
    #journee
    Friday 15 April 2022
    Journalisme scientifique et crise sanitaire
    UT3 Paul Sabatier, Bât. administratif de l’IUT A – Paul Sabatier, Amphi. Rosalind Franklin
    #journee
    Tuesday 5 October 2021
    Journée du GDR TAL 2021 : approches pluri-disciplinaire du Traitement Automatique des Langues
    UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
    #journee
    Thursday 1 April 2021
    BIR@ECIR : 11th International Workshop on Bibliometric-enhanced Information Retrieval – BIR 2021 – BIR 2021
    UT3 Paul Sabatier, En visioconférence
    #journee
    Tuesday 16 June 2020 – Friday 19 June 2020
    REPOUSSÉES À UNE DATE ULTÈRIEURE | JADT 2020 : 15es Journées Internationales d’Analyse statistique des Données Textuelles
    UT2 Jean Jaurès, Maison de la Recherche
    #journee
    Monday 26 March 2018
    Tutorial SSMT : Semantic Search on Medical Texts (co-located with ECIR 2018)
    Grenoble
    #journee
    Thursday 14 April 2016
    Journée d’étude du LabEx SMS : Les mondes de l’art au prisme de l’analyse de réseaux
    UT3 Paul Sabatier, IRIT, Salle du Conseil
    #journee