Partenaires



Rechercher



Accueil du site > Français > Thèmes de recherche > Thème 2 - Indexation et recherche d’informations > Équipe SIG > Les 4 composantes > SIG-EVI : Exploration et Visualisation d’Information

SIG-EVI : Exploration et Visualisation d’Information

Cet axe thématique étudie la conception de modèles et de méthodes pour la recherche de documents ou la construction d’informations élaborées dans un cadre contextuel et dynamique.

Le contexte fait référence à des connaissances implicites ou explicites concernant les intentions de l’utilisateur, son environnement, les informations manipulées et le système lui-même. L’intention de l’utilisateur (sa tâche) peut être de retrouver un ensemble restreint de (parties de) documents (recherche ad hoc, détection de la nouveauté, recherche de granules d’information) éventuellement dans un domaine spécifique.

Alternativement, elle peut être de collecter des masses d’information sur un domaine puis d’obtenir via des abstractions, des vues globales, lui permettant d’appréhender la structure du domaine (intelligence économique, veille technologique, découverte de connaissances). Ceci nous amène à proposer des méthodes d’analyse du besoin en particulier en intelligence économique (IE) et territoriale (IT). Outre la tâche, nos modèles intègrent les ressources disponibles (corpus de référence, représentation du domaine, thésaurus, ontologie) et leur format (XML, composition, méta-données). L’hypothèse est que l’explicitation du contexte améliore les performances de la RI et donc la satisfaction de l’utilisateur. Il s’agit donc de définir des modèles permettant de caractériser les contextes de RI, de reconnaître un contexte, et de définir les méthodes les plus adaptées au contexte. Nous prenons également en compte l’aspect temporel et les évolutions.

Ces recherches ont débouché sur des modèles d’indexation sémantique qui incluent l’étude des méta-données associées aux sources et aux documents, le géo-référencement, la granularité de l’information (composants XML) et la représentation des contenus. Cette indexation s’appuie sur des représentations de domaine via des hiérarchies de concepts (Projet IST IRAIA et stage), des ontologies de domaines comme dans OntoExplo (Projet Masse de Données en Astronomie), le projet BOPI (Banque d’objets pédagogiques et indexation 2007) et CAVALA (développement économique régional), ou des modèles de graphes (projet ANR GraphComp 2006). L’aspect dynamique de la connaissance et des documents est intégré dans l’indexation sémantique (projet ANR Dynamo). Pour une recherche ad hoc, l’aspect contextuel est étudié au travers de modèle mathématique détectant des corrélations entre modèles de recherche, formulation de requêtes et performances (projet ACRIC, 2007). Les méthodes de fouille de données s’appuient quant-à elles sur des modèles issus de l’analyse de données, de la théorie des graphes et des méthodes d’analyse des besoins en IE et IT que nous proposons. Les processus de visualisation de l’information dépendent des méthodes d’analyse et des objectifs de découverte de connaissances (graphes, cartes géographiques, etc.) (Projet Région Corinthe). L’analyse de l’évolution permet de comprendre un domaine et d’aider à la décision en prédisant une évolution future. L’expertise de la manipulation des différents modèles d’analyse par les acteurs (analyste, documentaliste, expert du domaine) est intégrée au sein du système, afin de valider l’information déduite. Le logiciel Tétralogie implante le résultat des recherches en exploration d’information. La méthode d’analyse de besoin en IE est complétée par un atelier logiciel (projet MEDESIIE).

Nos collaborations avec des collègues académiques en mathématiques (IMT-LPS, UPS), en linguistique (CLEE-ERSS, UTM), en gestion de connaissance (IC3, IRIT, UPS) et en économie (LEREPS, UT1) se traduisent par des projets et publications communes. Parallèlement, nos collaborations avec de nombreuses entreprises offrent un premier cadre d’évaluation ; une évaluation complémentaire est réalisée via la participation aux campagnes internationales d’évaluation TREC et INEX.

[8] le prototype OntoExplo - DocCube : Il permet l’exploration de corpus en Astronomie via des Ontologies supportées par des représentations visuelles. L’exploration est guidée par la tâche de recherche que l’on souhaite accomplir.

 

Système d’exploration d’information et de découverte de connaissances : le système Tetralogie

La plateforme Tétralogie est dédiée à la veille stratégique. Elle permet d’extraire des informations cachées, non connues à priori et utiles à partir de grandes masses d’informations (données textuelles ou factuelles issues de bases bibliographiques en ligne, de CR/Rom, d’Internet ou de toute autre source d’information). Ces connaissances peuvent en particulier être utiles pour la prise de décision ou pour avoir des vues globales de grandes collections d’informations. Ce système intègre les différents modules correspondant aux différentes étapes d’un processus de découverte de connaissances, chacune ayant des problématiques de recherche spécifiques associées.

Modules :

  • Collecte et filtrage de l’information : différents modules permettent de collecter de l’information en particulier sur le Web (module WhAT) et de filtrer l’information collectée par rapport à des profils (module Vigie).
  • Pré-traitement de l’information : l’information structurée ou semi-structurée est décrite pour extraire une structure adaptée son analyse.
  • Exploration de l’information : les modules implantent différentes techniques d’exploration baséess en particulier sur des méthodes d’analyse de données. Ces modules peuvent coopérer pour aboutir aux résultats finaux ou au contraire être utilisés en parallèle pour conforter les résultats obtenus.
  • Visualisation : l’information cachée découverte dans les masses d’informations (corrélations, ...) est visualisée sous forme graphique. Différents modules peuvent coopérer.

De nombreux outils de visualisation interopérables et distribués permettent de conduire des analyses d’information à plusieurs et à distance via le réseau.

Cette plateforme est complétée par le serveur Web Xplor qui permet de mettre en ligne les résultats de ces analyses stratégiques et qui offre, à l’utilisateur, la possibilité de naviguer dans l’information relationnelle et d’en tirer des graphes statistiques sur mesure.