UE : Fondements de la recherche d'information
Parcours :
D&C
Une UE de 6 ECTS : 40% C, 30% TD, 30% TPs
Responsable envisagée :
Lynda Tamine-Lechani
Objectifs :
Les processus de sélection et traitement d’informations issue(s) de
source(s) homogènes ou hétérogène(s) sont présents dans un large éventail
d’applications. L’objectif principal de cette unité d’enseignement est de
développer des compétences pour la sélection d’informations dites «
pertinentes » à partir de corpus d’informations ainsi que leur
organisation tout en préservant leur cohérence à l’issue des
traitements. Plus précisément, les objectifs sont les suivants
: (1) dresser une synthèse des concepts fondamentaux, des modèles
théoriques et des algorithmes de base de la recherche d’information, (2)
présenter les protocoles et les métriques standards d’évaluation des
performances d’un système de recherche d’information (3) utiliser ces
concepts et modèles comme briques de base de méthodes permettant
d’organiser en amont les informations et contrôler en aval leur intégrité
afin d’assurer leur cohérence.
Prérequis
- Matière 1 (Principes et modèles de la recherche d’information) est un
pré-requis de la matière 2 (Tâches et documents)
- Probabilités de base
- Introduction à l’apprentissage automatique
- Bases de données relationnelles
Contenu
Matière 1 - 3 ECTS : Principes et modèles de la recherche d’information
- Principes d’indexation de textes (non structurés, semi-structurés)
- Les modèles de recherche d’information
- Modèles de base (booléen, vectoriel)
- Modèles probabiliste (modèle probabiliste de base, modèle de
langue)
- Modèles basés sur l’apprentissage automatique
- Modèles thématiques
- Evaluation des performances d’un système de recherche d’information
- Démarche et protocoles d’évaluation des performances
Matière 2 - 1,5 ECTS : Tâches et documents
- Catégorisation de documents
- Méthodes vectorielles
- Méthodes génératives de base
- Evaluation de la qualité de la catégorisation
- Classification de documents
- Méthodes à plat
- Méthodes hiérarchiques
- Evaluation de la qualité de la classification
Matière 3 - 1,5 ECTS : Cohérence des traitements
- Introduction à la cohérence des informations
- Contraintes d'intégrité
- Concept de transaction
- Méthodes de contrôle des actions concurrentes
Compétences associées
- Apprendre à concevoir, mettre en œuvre et évaluer des performances
d’un système de recherche d’information
- Maîtriser les méthodes de structuration (thématique) automatique
d’informations
- Maîtriser les méthodes garantissant la cohérence des informations
Ouvrages de référence
- Recherche d’Information, Applications, modèles et algorithmes :
Massih-Reza Amini, Eric Gaussier, Editions Eyrolles, 2012
- Introduction to Information Retrieval : C.D. Manning, P. Raghavan, H.
Schütze, Cambridge University Press, 2008
- Les systèmes transactionnels: concepts, normes et produits.
Auteurs : BESANCENOT Jérôme, CART Michèle, FERRIÉ Jean, GUERRAOUI
Rachid, PUCHERAL Philippe, TRAVERSON
- Principles of Distributed Database Systems, February 2011.
M. Tamer Ozsu Patrick Valduriez.
Editor : Springer-Verlag New York Inc.; Edition : 3rd, ed. 2011
(February 2011), ED. Hermes
Mots-clés
Document/information, Index, Pertinence, Classes, Catégories, Cohérence,
Contrainte d'intégrité, Transaction, Contrôle de concurrence