Partenaires



Rechercher



Accueil du site > Français > Thèmes de recherche > Thème 2 - Indexation et recherche d’informations > Équipe SIG > Les 4 composantes > SIG-RFI : Modèles adaptatifs pour la recherche d’information

SIG-RFI : Modèles adaptatifs pour la recherche d’information

Les travaux de recherche centrés sur cette thématique visent la mise en œuvre de systèmes de recherche d’information fondés sur des modèles théoriques approuvés et s’appuient sur des approches qui allient théories et expérimentations en considérant différents facteurs internes et facteurs externes liés à l’information manipulée et à son contexte. Plus précisément, les problématiques qui sont au cœur des travaux de ce groupe portent sur la prise en compte de l’hétérogénéité des informations manipulées, de la diversité des utilisateurs et leurs contextes, du sens de l’information véhiculé par son contenu textuel, ainsi que son volume.

La gestion de l’hétérogénéité de l’information a pour objectif de considérer l’ensemble des facteurs liés à la variété de ses formats, de son contenu, de ses structures, des langues, des métadonnées et ce tant du point de vue de sa représentation que de sa sélection en vue de retourner des résultats uniformes ou issus d’une phase d’agrégation qui privilégie la diversité de leurs types.

L’objectif de la personnalisation de l’information est d’intégrer l’utilisateur dans le processus global d’accès à l’information en vue d’adapter les différentes étapes (recherche, filtrage, navigation, visualisation) à son contexte. Ce dernier intègre ses centres d’intérêts, ses préférences, son environnement cognitif et spatio-temporel, les réseaux sociaux auxquels il appartient.

La prise en compte du sens de l’information revient à couvrir la sémantique véhiculée par l’information aussi bien au niveau de la représentation que de l’accès. Pour cela, des ressources préexistantes telles que les ontologies, les thesaurus et les métadonnées issues d’utilisateurs (folksonomie), d’experts ou alors construites automatiquement, peuvent être utilisées.

L’ensemble de ces travaux est consolidé par une importante démarche de validation et d’évaluation expérimentale dans le cadre de campagnes d’évaluation internationales : TREC (Text REtrieval Conference. Campagne internationale d’évaluation de moteurs de recherche), CLEF (Cross Language Evaluation Forum. Campagne internationale d’évaluation de la RI multilingue, INEX (INitiative for the Evaluation of XML retrieval. Campagne internationale d’évaluation de la RI dans les documents XML).

Cette activité est structurée au niveau du laboratoire autour de la plate-forme de recherche d’information OSIRIM. Cette plateforme a un double objectif, le premier est de proposer un cadre (services, moyens, expériences) pour valider les activités de recherche via des procédures de tests obtenues dans des contextes comme TREC, CLEF, INEX ; le second est de construire un pôle de compétence à étage régional puis national sur le thème de la recherche d’information multimédia.

Résultats

Les principaux résultats de recherche obtenus concernent la proposition de modèles adaptatifs de recherche d’information : MERCURE, classé parmi les meilleurs moteurs dans le cadre du programme d’évaluation international TREC (1997). Ce moteur représente aujourd’hui le noyau sur lequel repose d’autres travaux effectués au sein de l’équipe SIG de l’IRIT, (2) le modèle FILTRE permettant le filtrage personnalisé et adaptatif de l’information, (3) le modèle XFIRM pour la recherche flexible dans des documents semi-structurés, (4) les modèles DocTree et DocCore pour la représentation conceptuelle et sémantique des documents, (5) le modèle SiRIX pour l’accès personnalisé à l’information.

Toutes les compétences capitalisées se sont concrétisées en 2006/2007 par notre participation au projet QUAERO, destiné à développer des outils intégrés de gestion de contenus multimédias dont un moteur de recherche qui devrait permettre de rechercher du texte, des images, du son et de la vidéo. Nous sommes impliqués dans les "workpackages" technologique et d’évaluation destinés à la mise en œuvre d’un moteur de recherche textuelle compte tenu de nos compétences démontrées à travers de nombreuses participations à TREC, CLEF, INEX.

[7] DocCore est un prototype de recherche conceptuelle d’informations via des visualisations graphiques de réseaux de concepts.