team publications

International journals articles
  • Marie Neihouser, Julien Figeac, Ferdinand Le-Coz

    Faire campagne dans Facebook Une pratique privilégiée par l’extrême droite et les partis émergents

    Politiques de communication, 2023, 19, pp.55-86. ⟨10.3917/pdc.019.0055⟩

    Accès: https://hal.science/hal-04223259

  • Alexis Dusart, Karen Pinel-Sauvagnat, Gilles Hubert

    Exploring unsupervised textual representations generated by neural language models in the context of automatic tweet stream summarization

    Online Social Networks and Media, 2023, 37-38, pp.100272. ⟨10.1016/j.osnem.2023.100272⟩

    Accès: https://hal.science/hal-04283766

  • Frédérique Bordignon, Guillaume Cabanac, Cyril Labbé, Maud Bernisson

    Fraud, exaggerations, and ghost authorship: questioning the reliability of the scholarly record

    Ingenius, 2023

    Accès: https://enpc.hal.science/hal-04094363

  • Frédérique Bordignon, Guillaume Cabanac, Cyril Labbé, Maud Bernisson

    Fraudes, exagérations et auteurs fantômes : la fiabilité de la littérature scientifique en question

    Ingenius, 2023, pp.1–3

    Accès: https://enpc.hal.science/hal-04094361

  • Pedro G Vásquez-Ocmín, Guillaume Marti, Alice Gadea, Guillaume Cabanac, Juan Vásquez-Briones, Sandro Casavilca-Zambrano, Nadia Ponts, Patricia Jargeat, Mohamed Haddad, Stéphane Bertani

    Metabotyping of Andean pseudocereals and characterization of emerging mycotoxins

    Food Chemistry, 2023, 407 : Special issue Metabolomics in food, pp.135134. ⟨10.1016/j.foodchem.2022.135134⟩

    Accès: https://hal.science/hal-04041003

  • Alexis Dusart, Karen Pinel-Sauvagnat, Gilles Hubert

    TSSuBERT: How to Sum Up Multiple Years of Reading in a Few Tweets

    ACM Transactions on Information Systems, 2023, 41 (4), pp.109-1–109-33. ⟨10.1145/3581786⟩

    Accès: https://hal.science/hal-04066735

  • Sherman Aline, Gilles Hubert, Yoann Pitarch, Rallou Thomopoulos

    Infant food users’ perceptions of safety: A web-based analysis approach

    Frontiers in Artificial Intelligence, 2023, 6 (Section : AI in Food, Agriculture and Water), pp.1080950. ⟨10.3389/frai.2023.1080950⟩

    Accès: https://hal.inrae.fr/hal-03999522

  • Marie-Benoît Magrini, Tristan Salord, Guillaume Cabanac

    The unbalanced development among legume species regarding sustainable and healthy agrifood systems in North-America and Europe

    Food Security, 2023, 15 (1), pp.187-200. ⟨10.1007/s12571-022-01294-9⟩

    Accès: https://hal.inrae.fr/hal-03762801

  • Lila Boualili, Jose G. Moreno, Mohand Boughanem

    Highlighting exact matching via marking strategies for ad hoc document ranking with pretrained contextualized language models

    Information Retrieval Journal, 2022, 25 (4), pp.414-460. ⟨10.1007/s10791-022-09414-x⟩

    Accès: https://hal.science/hal-03881847

  • Matteo Lascialfari, Marie-Benoît Magrini, Guillaume Cabanac

    Unpacking research lock-in through a diachronic analysis of topic cluster trajectories in scholarly publications

    Scientometrics, 2022, 127 (11), pp.6265-6189. ⟨10.1007/s11192-022-04514-3⟩

    Accès: https://hal.inrae.fr/hal-03791799

  • National journals articles
  • Nathalie Aussenac-Gilles, Nathalie Bricon-Souf, Lynda Tamine

    Introduction (RSTI 37 : Numéro spécial TSI )

    Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, 2018, Information médicale : représentation et traitement, 37 : Numéro spécial TSI – Technique et Science Informatiques (1-6), pp.7–9. ⟨10.3166/tsi37-0006⟩

    Accès: https://hal.science/hal-02924569

  • Thomas Palmer, Gilles Hubert, Karen Pinel-Sauvagnat

    Retweeter ou ne pas retweeter

    Document numérique – Revue des sciences et technologies de l’information. Série Document numérique, 2018, 21 (3), pp.81-103. ⟨10.3166/DN.21.3.81-103⟩

    Accès: https://hal.science/hal-02064611

  • Cécile Favre, Chloé Artaud, Clément Duffau, Ophélie Fraisier, Roland Kotto-Kombi

    Forum Jeunes Chercheurs à Inforsid 2016

    Revue des Sciences et Technologies de l’Information – Série ISI : Ingénierie des Systèmes d’Information, 2017, 22 (2), pp.121-147

    Accès: https://hal.science/hal-01914115

  • National journals articles
    International conferences articles
  • Jesus Lovon, Jose G. Moreno, Romaric Besançon, Lynda Tamine, Olivier Ferret

    MEERQAT-IRIT at SemEval-2023 task 2: Leveraging contextualized tag descriptors for multilingual named entity recognition

    17th International Workshop on Semantic Evaluation (SemEval 2023), Jul 2023, Toronto, Canada. pp.878-884, ⟨10.18653/v1/2023.semeval-1.121⟩

    Accès: https://hal.science/hal-04350288

  • Maxime Arens, Charles Teissèdre, Lucile Callebert, Jose G. Moreno, Mohand Boughanem

    Impact de l’apprentissage multi-labels actif appliqué aux transformers

    18ème Conférence en Recherche d’Information et Applications (CORIA 2023), Jun 2023, Paris, France. pp.2-17

    Accès: https://hal.science/hal-04131550

  • Nihed Bendahman, Karen Pinel-Sauvagnat, Gilles Hubert, Mokhtar Boumedyen Billami

    Quelles évolutions sur cette loi ? Entre abstraction et hallucination dans le domaine du résumé de textes juridiques

    18ème Conférence en Recherche d’Information et Applications (CORIA 2023), Association francophone de Recherche d’Information et Applications (ARIA); Association pour le Traitement Automatique des Langues (ATALA), Jun 2023, Paris, France. pp.18-36

    Accès: https://hal.science/hal-04131561

  • Jesus Lovon, Jose G. Moreno, Romaric Besançon, Olivier Ferret, Lynda Tamine

    Reconnaissance d’entités nommées fondée sur des modèles de langue enrichis avec des définitions des types d’entités

    18e Conférence en Recherche d’Information et Applications – 30e Conférence sur le Traitement Automatique des Langues Naturelles (CORIA TALN 2023), Association francophone de Recherche d’Information et Applications (ARIA); Association pour le Traitement Automatique des Langues (ATALA), Jun 2023, Paris, France. pp.185-194

    Accès: https://hal.science/hal-04131547

  • Raphaël Sourty, Jose G. Moreno, François-Paul Servant, Lynda Tamine

    Enrichissement des modèles de langue pré-entraînés par la distillation mutuelle des connaissances

    18e Conférence en Recherche d’Information et Applications — 30e Conférence sur le Traitement Automatique des Langues Naturelles (CORIA TALN 2023), Jun 2023, Paris, France. pp.139-156

    Accès: https://hal.science/hal-04131552

  • Lila Boualili, Jose G. Moreno, Mohand Boughanem

    Highlighting exact matching via marking strategies for ad hoc document ranking with pretrained contextualized language models

    18ème Conférence en Recherche d’Information et Applications (CORIA 2023), Association francophone de Recherche d’Information et Applications (ARIA); Association pour le Traitement Automatique des Langues (ATALA), Jun 2023, Paris, France. pp.201-201

    Accès: https://hal.science/hal-04131567

  • Jesus Lovon, Jose G. Moreno, Romaric Besançon, Olivier Ferret, Lynda Tamine

    Can we guide a multi-hop reasoning language model to incrementally learn at each single-hop?

    29th International Conference on Computational Linguistics (COLING 2022), Oct 2022, Gyeongju, South Korea. pp.1455-1466

    Accès: https://hal.science/hal-03885173

  • Prince Jha, Gaël Dias, Alexis Lechervy, Jose G. Moreno, Anubhav Jangra, Sebastião Pais, Sriparna Saha

    Combining Vision and Language Representations for Patch-based Identification of Lexico-Semantic Relations

    30th ACM International Conference on Multimedia (ACM MM 2022), Oct 2022, Lisbonne, Portugal. pp.4406-4415, ⟨10.1145/3503161.3548299⟩

    Accès: https://hal.science/hal-03720737

  • Anna Abalkina, Guillaume Cabanac, Cyril Labbé, Alexander Magazinov

    Improper legitimization of hijacked journals through citations

    9th International Congress on Peer Review and Scientific Publication (2022), JAMA Network, Sep 2022, Chicago, United States. ⟨10.48550/arXiv.2209.04703⟩

    Accès: https://ut3-toulouseinp.hal.science/hal-03777383

  • Raphaël Sourty, Jose G. Moreno, Lynda Tamine, François-Paul Servant

    CHERCHE: A New Tool to Rapidly Implement Pipelines in Information Retrieval

    45th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2022), ACM SIGIR: Special Interest Group in Information Retrieval, Jul 2022, Madrid, Spain. pp.3283-3288, ⟨10.1145/3477495.3531695⟩

    Accès: https://hal.science/hal-03885055

  • National conferences articles
  • Alexandre Clausse, Guillaume Cabanac, Pascal Cuxac, Cyril Labbé

    Extraction d’acronymes torturés dans la littérature scientifique

    Atelier TextMine de la conférence Extraction et Gestion des Connaissances (EGC) de 2024, Jan 2024, Dijon (Bourgogne), France

    Accès: https://hal.science/hal-04426448

  • Guillaume Cabanac

    Signalement d’articles scientifiques non fiables par traque de marqueurs de Fake Science

    Journée science ouverte : logiciels libres et fouille de textes 2023, DDOR CNRS : Direction des Données ouvertes de la recherche, Nov 2023, Paris, France

    Accès: https://ut3-toulouseinp.hal.science/hal-04301588

  • Emanuela Boros, Jose G. Moreno, Antoine Doucet

    L’importance des entités pour la tâche de détection d’événements en tant que système de question-réponse

    Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.374-383

    Accès: https://hal.science/hal-03701488

  • Marie-Benoît Magrini, Tristan Salord, Guillaume Cabanac

    Caractériser la performance des trajectoires scientifiques sous le prisme des sources de financement de la recherche

    Journée d’études : L’argent de la science (2021), INRAE, Jun 2021, Toulouse (visoconférence), France. pp.1-7

    Accès: https://hal.inrae.fr/hal-03261154

  • Emanuela Boros, Ahmed Hamdi, Elvys Linhares Pontes, Luis Adrián Cabrera-Diego, Jose G. Moreno, Nicolas Sidere, Antoine Doucet

    Atténuer les erreurs de numérisation dans la reconnaissance d’entités nommées pour les documents historiques

    Conférence en Recherche d’Informations et Applications (CORIA 2021), ARIA : Association Francophone de Recherche d’Information (RI) et Applications, Apr 2021, Grenoble (virtuel), France. pp.1 – 7, ⟨10.24348/coria.2021.mini_24⟩

    Accès: https://hal.science/hal-03320332

  • Paul Mousset, Yoann Pitarch, Lynda Tamine

    Régularisation spatiale de représentations distribuées de mots

    16ème Conférence francophone en Recherche d’Information et Applications (CORIA 2019), Apr 2019, Lyon, France. pp.1-17

    Accès: https://hal.science/hal-02494102

  • Thiziri Belkacem, Taoufiq Dkaki, Jose G. Moreno, Mohand Boughanem

    aMV-LSTM: an attention-based model with multiple positional text matching

    34th ACM/SIGAPP Symposium on Applied Computing (SAC 2019), Apr 2019, Limassol, Cyprus. pp.788-795

    Accès: https://hal.science/hal-02441990

  • Gilles Hubert, Yoann Pitarch, Karen Pinel-Sauvagnat, Ronan Tournier, Léa Laporte

    TournaRank : Quand la recherche d’information devient un tournoi entre documents

    15e Conference francophone en Recherche d’Information et Applications (CORIA 2018), May 2018, Rennes, France. pp.1-16

    Accès: https://hal.science/hal-02305352

  • Thiziri Belkacem, Taoufiq Dkaki, Jose G. Moreno, Mohand Boughanem

    Impact de la présence/absence des termes de la requête dans le document sur le processus d’appariement document-requête en utilisant Word2Vec

    15e Conference francophone en Recherche d’Information et Applications (CORIA 2018), May 2018, Rennes, France. pp.1-16

    Accès: https://hal.science/hal-02305347

  • Gia-Hung Nguyen, Lynda Tamine, Laure Soulier, Nathalie Bricon-Souf

    Apprentissage de représentation des documents médicaux guidé par les concepts pour la recherche d’information

    4e Symposium sur l’Ingénierie de l’Information Médicale (SIIM 2017), Nov 2017, Toulouse, France. pp.1-8

    Accès: https://hal.science/hal-02316857

  • Books
  • Emanuela Boros, Jose G. Moreno, Antoine Doucet

    Exploring Entities in Event Detection as Question Answering

    Matthias Hagen; Suzan Verberne; Craig Macdonald; Christin Seifert; Krisztian Balog; Kjetil Nørvåg; Vinay Setty. Advances in Information Retrieval: 44th European Conference on IR Research, ECIR 2022, Stavanger, Norway, April 10–14, 2022, Proceedings, Part I, 13185 (Part 1), Springer International Publishing, pp.65-79, 2022, Lecture Notes in Computer Science book series (LNCS), 978-3-030-99735-9. ⟨10.1007/978-3-030-99736-6_5⟩

    Accès: https://hal.science/hal-03635982

  • Tran Thi Hong Hanh, Antoine Doucet, Nicolas Sidere, Jose G. Moreno, Senja Pollak

    Named Entity Recognition Architecture Combining Contextual and Global Features

    Hao-Ren Ke; Chei Sian Lee; Kazunari Sugiyama. Towards Open and Trustworthy Digital Societies. 23rd International Conference on Asia-Pacific Digital Libraries, ICADL 2021, Virtual Event, December 1–3, 2021, Proceedings, 13133, Springer, pp.264-276, 2021, Lecture Notes in Computer Science, 978-3-030-91668-8. ⟨10.1007/978-3-030-91669-5_21⟩

    Accès: https://hal.science/hal-03480557

  • Elvys Linhares Pontes, Luis Adrián Cabrera-Diego, Jose G. Moreno, Emanuela Boros, Elvys Linhares Pontes, Ahmed Hamdi, Nicolas Sidère, Mickaël Coustaty, Antoine Doucet

    Entity Linking for Historical Documents: Challenges and Solutions

    22nd International Conference on Asia-Pacific Digital Libraries, ICADL 2020, 12504, Springer, pp.215-231, 2020, Lecture Notes in Computer Science, 978-3-030-64452-9. ⟨10.1007/978-3-030-64452-9_19⟩

    Accès: https://hal.science/hal-03034492

  • Mohand Boughanem, Imen Akermi, Gabriella Pasi, Karam Abdulahhad

    Artificial Intelligence and Information Retrieval

    Prade, Henri. A guided tour of artificial intelligence research, 3, Springer-Verlag, pp.147-180, 2020, Interfaces and Applications of Artificial Intelligence, 978-3-030-06169-2. ⟨10.1007/978-3-030-06170-8_5⟩

    Accès: https://hal.science/hal-03001574

  • Michel Zitt, Alain Lelu, Martine Cadot, Guillaume Cabanac

    Bibliometric delineation of scientific fields

    Wolfgang Glänzel; Henk F. Moed; Ulrich Schmoch; Mike Thelwall. Handbook of Science and Technology Indicators, Springer International Publishing, pp.25-68, 2019, Handbook of Science and Technology Indicators, 978-3-030-02510-6. ⟨10.1007/978-3-030-02511-3_2⟩

    Accès: https://hal.science/hal-01942528

  • Guillaume Cabanac, Ingo Frommholz, Philipp Mayr

    Bibliometric-enhanced information retrieval

    Cabanac; Guillaume and Frommholz; Ingo and Mayr; Philipp. Springer, 116 (2), 2018, Scientometrics, special issue, ⟨10.1007/s11192-018-2861-0⟩

    Accès: https://hal.science/hal-02982579

  • Philipp Mayr, Ingo Frommholz, Guillaume Cabanac, Muthu Kumar Chandrasekaran, Kokil Jaidka, Min-Yen Kan, Dietmar Wolfram

    Bibliometric-Enhanced Information Retrieval and Natural Language Processing for Digital Libraries

    Mayr; Philipp and Frommholz; Ingo and Cabanac; Guillaume and Chandrasekaran; Muthu Kumar and Jaidka; Kokil and Kan; Min-Yen and Wolfram; Dietmar. Springer, 19 (2-3), 2018, International Journal on Digital Libraries, ⟨10.1007/s00799-017-0230-x⟩

    Accès: https://hal.science/hal-02982554

  • Karen Pinel-Sauvagnat

    Propagation-Based Structured Text Retrieval

    Liu, Ling, Georgia Institute of Technology, Atlanta, USA; Özsu, M. Tamer, University of Waterloo, Waterloo, Canada. Encyclopedia of Database Systems, revised edition, Springer, pp.1–6, 2017, 978-0-387-39940-9. ⟨10.1007/978-1-4899-7993-3_281-2⟩

    Accès: https://hal.science/hal-03131903

  • Marie-Noelle Bessagnet, Guillaume Cabanac, Eric Kergosien, Joachim Schöpfel

    Actes Du 1er Atelier Valorisation et Analyse Des Données de La Recherche (VADOR 2017) Organisé Durant La 35e Édition Du Congrès Informatique Des Organisations et Systèmes d’Information et de Décision (INFORSID 2017), Toulouse, France, May 31, 2017

    Bessagnet; Marie-Noëlle and Cabanac; Guillaume and Kergosien; Éric and Schöpfel; Joachim. CEUR-WS, 1860, 2017, CEUR Workshop Proceedings

    Accès: https://univ-pau.hal.science/hal-01913202

  • Thesis and HDR
  • Alexis Dusart

    S’informer sur les médias sociaux via l’élaboration d’information synthétique

    Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30222⟩

    Accès: https://theses.hal.science/tel-04047847

  • Tahar-Rafik Boudiba

    Modèles neuronaux de recommandation basés sur les folksonomies

    Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30256⟩

    Accès: https://theses.hal.science/tel-04057677

  • Lila Boualili

    Deep learning for information retrieval : studying relevant signals for ad hoc search based on transformer models

    Library and information sciences. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30188⟩

    Accès: https://theses.hal.science/tel-03969050

  • Luis Eduardo Lugo Martinez

    Modelling patterns of search behaviours from user interactions

    Information Retrieval [cs.IR]. Université Paul Sabatier – Toulouse III, 2021. English. ⟨NNT : 2021TOU30196⟩

    Accès: https://theses.hal.science/tel-03667342

  • Paul Mousset

    Modèles neuronaux pour la représentation et l’appariement d’objets géotextuels

    Interface homme-machine [cs.HC]. Université Paul Sabatier – Toulouse III, 2020. Français. ⟨NNT : 2020TOU30042⟩

    Accès: https://theses.hal.science/tel-02979573

  • Thiziri Belkacem

    Neural models for information retrieval : towards asymmetry sensitive approaches based on attention models

    Information Retrieval [cs.IR]. Université Paul Sabatier – Toulouse III, 2019. English. ⟨NNT : 2019TOU30167⟩

    Accès: https://theses.hal.science/tel-02499432

  • Gia-Hung Nguyen

    Modèles neuronaux pour la recherche d’information : approches dirigées par les ressources sémantiques

    Informatique et langage [cs.CL]. Université Paul Sabatier – Toulouse III, 2018. Français. ⟨NNT : 2018TOU30233⟩

    Accès: https://theses.hal.science/tel-02507902

  • Ophélie Fraisier

    Détection des points de vue sur les médias sociaux numériques

    Informatique [cs]. Université Paul Sabatier – Toulouse III, 2018. Français. ⟨NNT : 2018TOU30200⟩

    Accès: https://theses.hal.science/tel-02288853v2

  • Abdelhamid Chellal

    Event summarization on social media stream : retrospective and prospective tweet summarization

    Information Retrieval [cs.IR]. Université Paul Sabatier – Toulouse III, 2018. English. ⟨NNT : 2018TOU30118⟩

    Accès: https://theses.hal.science/tel-02276764

  • Karen Pinel-Sauvagnat

    De la recherche de granules documentaires à l’agrégation d’information

    Recherche d’information [cs.IR]. Université Paul Sabatier (Toulouse 3), 2018

    Accès: https://theses.hal.science/tel-01865051v2

  • Reports
  • Tatiana Petrasova, Giuliano Volpe, Elise Massicard, Natacha Aveline-Dubach, David Ambrosetti, Frédérique Langue, Jean-Christophe Peyssard, Nathalie Vienne-Guerrin, Isabelle Luciani, Lorenzo Barrault-Stella, Damien Cartron, Renaud Crespin, Guillaume Cabanac, Naceur Chaabane, Marc Fleurbaey, Michela Russo, Isabelle Sayn, Bruno Ambroise

    Rapport de prospective du Conseil scientifique de l’Institut des sciences humaines et sociales du CNRS (CSInSHS) 2023

    Comité Nationale de la Recherche Scientifique. 2023, 79 p

    Accès: https://shs.hal.science/halshs-04362325

  • Guillaume Cabanac

    Decontamination of the scientific literature

    Institut Universitaire de France. 2022

    Accès: https://ut3-toulouseinp.hal.science/hal-03835147

  • Tristan Salord, Marie-Benoît Magrini, Guillaume Cabanac, Marie Josèphe Amiot Carlin, Marc Anton, Adeline Boire, Jean-Michel Chardigny, Colette Larré, Valérie Micard, Christophe Nguyen-Thé, Stephane Walrand‌

    A roadmap for mapping Food Science and Technology from scholarly publications on pulses

    INRAE. 2022, pp.1-44

    Accès: https://hal.inrae.fr/hal-04373646v2

  • Jennifer Byrne, Yasunori Park, Amanda Capes-Davis, Bertrand Favier, Guillaume Cabanac, Cyril Labbé

    Seek & Blastn Standard Operating Procedure

    [Technical Report] Seek&Blastn Team. 2021

    Accès: https://hal.science/hal-03117303

  • Nathalie Chauvac, Brice Navereau, Michel Grossetti, L Jégou, Marion Maisonobe, Guillaume Cabanac

    Rapport pour le CCRRDT-OCCITANIE : Localisation géographique de la production scientifique en Occitanie

    Laboratoire Interdisciplinaire Solidarités, Sociétés, Territoires (LISST); Région Occitanie – Comité Consultatif Régional pour la Recherche et le Développement Technologique (CCRRDP). 2020

    Accès: https://shs.hal.science/halshs-04263450

  • Pascal Marchand, Brigitte Sebbah, Julie Renard, Guillaume Cabanac, Laurent Thiong-Kay, Natacha Souillard, Lucie Loubère

    « Vrai débat » : sortir du débat pour négocier

    [Rapport de recherche] Université de Toulouse. 2019

    Accès: https://hal.science/hal-02976611

  • Reports Other publications