Menu:

Partenaires:

CAAS

Les systèmes de recherche d'informations (SRI) visent à restituer les informations qui répondent aux besoins d'un utilisateur exprimé sous la forme d’une requête. La recherche automatique d'informations pertinentes par rapport à une requête implique un processus en deux étapes: hors ligne, le système indexe des documents en utilisant généralement une représentation sac de de mots; en ligne, le système calcule la similitude entre la requête de l'utilisateur et les représentations de chaque document (ses termes d'indexation) pour décider des documents les plus ressemblants. Les SRI actuels, par exemple les moteurs de recherche sur le Web, sont des outils de recherche généraux mettant en oeuvre les mêmes mécanismes et les mêmes méthodes de traitement de données et de correspondance, quel que soit le contexte de la recherche : l'utilisateur, le type de besoins de l'information, ou l'utilisation de l'information.

L’hypothèse du projet CAAS est que la prise en compte de ce contexte pourrait pourtant améliorer les performances d’un SRI en expliquant certains éléments de la recherche d'information. L'aspect contextuel se réfère à la connaissance tacite ou explicite concernant les intentions des utilisateurs, l'environnement de ceux-ci et le système lui-même.

Les questions scientifiques fondamentales traitées dans le projet CAAS sont:

Pour aborder ces défis, CAAS a considéré les divers aspects qui peuvent impacter le processus de RI d'abord de façon indépendantes, considérant ensuite les effets croisés. Nous nous sommes principalement concentrés sur les éléments contextuels suivant:

Pour chacun d'entre eux, nous avons considéré des diverses collections que nous avons caractérisées. Nous les avons analysés en détail dans le but d'extraire des modèles et des comportements. Une fois que chaque élément contextuel a été étudié le plus indépendamment que possible des autres, nous avons considéré les effets croisés. Par exemple, nous avons montré que les caractéristiques des requêtes permettait de savoir si l’expansion de requête était utile ou non.

Dans CAAS, nous avons utilisé à la fois des collections de référence des programmes internationaux comme TREC que des collections plus réalistes issues de nos partenaires entreprises.

L'analyse et l'extraction de modèles sont au coeur du projet. Cependant, nous avons également développé des prototypes issus de nos recherches. Certains modules s’appuient sur les plateformes de recherche comme Terrier de sorte qu’ils peuvent être réutilisés dans d’autres applications. Le partenariat du projet est uniquement universitaire ; cependant, les entreprises sont également présentes et sont impliquées de plusieurs façons: d'abord Nomao et Revue.org nous ont fourni des logs de requêtes.

Plus précisément, au début du projet le consortium était composé de deux instituts en sciences informatiques, tous les deux spécialistes en RI, mais avec des compétences complémentaires. Le LIA (Laboratoire Informatique d’Avignon) travaille sur les systèmes Question/Réponse, tandis que l'IRIT (Institut de Recherche en Informatique de Toulouse) comprend des spécialistes en recherche Adhoc et détection de la nouveauté. L’IRIT travaille en relation avec l’IMT (Institut de Mathématique de Toulouse) et pour ce projet avec le groupe Statistique et Probabilité. Même si l’IMT n'apparaît pas comme un partenaire, ils travailleront dans ce projet. En effet l’IRIT et l’IMT sont des partenaires dans le Plan Pluri-formation FREMIT qui vise à développer le travail collaboratif. Le laboratoire CLLE (Connaissance, Langues, Langage, Ergonomie) est partenaire de ce projet pour leurs compétences linguistiques. CLLE collabore depuis de nombreuses années avec l’IRIT (Mothe et Tanguy, 2005) pour la RI et le traitement automatique des langues. Un des membres du consortium ayant été promu au LSIS, ce laboratoire a rejoint le projet en 2012.