Nos partenaires

CNRS

Rechercher





Accueil du site > Français > Evénements > Soutenances > Soutenances d’HDR

Soutenances d’HDR

 

 

De la recherche de granules documentaires à l'agrégation d'information

Karen PINEL-SAUVAGNAT - Equipe IRIS - IRIT

Vendredi 13 Juillet 2018, 10h30
UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
Version PDF :

Jury

Nathalie Aussenac-Gilles, Directrice de Recherche CNRS, Université Toulouse 3, Examinatrice
Patrice Bellot, Professeur, Aix-Marseille Université, Rapporteur
Catherine Berrut, Professeure, Université Grenoble-Alpes, Rapporteuse
Mohand Boughanem, Professeur, Université Toulouse 3, Garant
Patrick Gallinari, Professeur, UPMC Paris, Rapporteur
Eric Gaussier, Professeur, Université Grenoble-Alpes, Examinateur

Mots clés

recherche d'information, documents XML, médias sociaux, entités, agrégation d'information, évaluation

Résumé

L'expansion du Web depuis la fin des années 90 a modifié en profondeur le fonctionnement des Systèmes de Recherche d'Information (SRI). Côté documents, des données sons, images et vidéos sont venues s'ajouter au texte traditionnellement traité par les SRI. Le texte lui-même s'est transformé, cette mutation étant soutenue par l'expansion des réseaux sociaux et les contenus générés par les utilisateurs.
Côté modèles et présentation des résultats, les moteurs de recherche Web, après avoir longtemps proposé aux utilisateurs les fameux 10 liens bleus en réponse à leur requête, incluent maintenant dans leurs pages de résultats des images, des vidéos ou encore des actualités. Lorsque la requête est une entité, un cadre séparé peut également présenter des informations liées. L'idée n'est plus de restituer des documents relatifs à une requête, mais de donner directement à l'utilisateur un aperçu global de l'information liée à son besoin.

C'est autour de cette dernière idée que la recherche d'information agrégée a été définie dès 2008, avec pour but de chercher et d'assembler dans une seule interface de l'information utile sous forme de granules d'information provenant d'une ou plusieurs sources. Dans ce cadre, mes recherches se sont plus particulièrement orientées vers :
- la recherche de granules d'information. Cet axe porte sur des questions de Recherche d'Information adhoc classique relatives à la sélection de granules pertinents répondant à une requête. Nous avons considéré trois sources d'information spécifiques: (i) les collections de documents semi-structurés de type XML, afin de retrouver des granules textuels ou image; (ii) les plateformes de microblogging de type Twitter, nécessitant un traitement temps-réel des informations; (iii) le Web, pour des problématiques liées aux requêtes de type entité (recherche de relations autour de l'entités et d'informations nouvelles la concernant).
- l'agrégation des résultats. Plus particulièrement, nous avons travaillé sur l'agrégation des relations liées à des entités, ainsi que sur le résumé temporel d'informations provenant de documents pertinents autour des entités.

Enfin, une dernière partie de mes travaux concerne de façon transverse l'évaluation des systèmes, à travers le montage de collections de test ou la définition de protocoles d'évaluation.

 

Retour