Nos partenaires

CNRS

Rechercher





Accueil du site > Français > Axes stratégiques > Masses de données et calcul

Problématique et défis

La problématique centrale de cet axe peut se décliner selon :

  • des infrastructures adéquates (middleware, grille, P2P, réseau,...),
  • des modèles et des méthodes pour la représentation et le traitement de ces masses de données (stockage, calcul, simulation, optimisation, indexation,...)
  • de nouveaux modes d’interactions et d’utilisation (homme-données) : web sémantique, web 2.0, multimodalité, réalité augmentée, virtuelle,....

Un des aspects spécifiques de cet axe est lié à l’évolution des problématiques d’indexation et de recherche d’information, conduisant à considérer les différentes dimensions de l’adaptation (à l’utilisateur, au contexte, aux dispositifs, aux moteurs d’indexation disponibles, etc.) en particulier dans le domaine de la mobilité, et en lien avec les axes « Systèmes Embarqués » et « Systèmes Ambiants ». Ces différentes dimensions intègrent de bout en bout les étapes du process, i.e. les services, les requêtes, les données et métadonnées associées, les résultats et leur présentation/visualisation. Les processus de recherche de l’information doivent bien évidemment prendre en compte flexibilité et personnalisation, tout en maintenant une Qualité de Service.

Notre effort porte plus particulièrement sur

  • d’une part, l’élaboration de modèles pour la représentation, l’accès, l’analyse, la fouille et la manipulation de collections d’informations complexes. Sur des données textuelles (documents disponibles sur le Web ou produits par des domaines spécifiques (astronomies, biologie ...) nous étudions des outils de recherche capables de rechercher l’information pertinente. Dans ce contexte la prise en compte du sens de l’information revient à couvrir la sémantique véhiculée par l’information aussi bien au niveau de la représentation que de l’accès.
  • d’autre part, le traitement de données (indexation, simulation, assimilation) et les outils logiciels d’accès aux ressources. Le travail sur les intergiciels de grille doit se poursuivre pour notamment offrir une grande robustesse d’accès au ressources logicielles (services) et ce indépendamment des risques de panne matériel. Les approches algorithmiques pour la simulation numérique doivent par contre être revisitées pour prendre en compte l’évolution des matériels (machines multicoeurs et grille de calcul) : le paradigme, faire moins d’opérations pour aller plus vite n’est plus valide. Finalement, en analyse automatique de données audiovisuelles, notre effort portera sur les aspects indexation temps réels de flux, la fusion d’index audio et vidéo ainsi qu’au calcul de distances entre contenus audiovisuels.