UE Traitement Automatique des langues et ontologies
M2 - 6 ECTS

Parcours type : D&C

Responsable :

Farah Benamara

Équipe pédagogique :

Nathalie Aussenac Gilles, Nicholas Asher, Stergos Afantenos, Farah Benamara, Andrèas Herzig, Cassia Torjan, Mouna Kamel, Tim Van de Cruys, Laure Vieu, Philippe Muller

Contenu :

Matière 1 : Traitement automatique du langage naturel - 3 ECTS - 20% C, 60% TD, 20% TPs

Responsable envisagé:
Farah Benamara
Objectifs :

Le langage naturel est le moyen par excellence de communiquer des masses d'informations complexes et nuancées à des milliards de personnes. Le succès des techniques de dissémination comme le web témoignent de l'ubiquité et de l'utilité d'encoder des informations en langage naturel. Cependant, l'extrait des informations du web, ou autre source langagière, de manière automatisée, reste un défi théorique et technique.

L’objectif de cette UE est de donner les bases linguistiques et des exemples d'applications computationnelles dans le domaine du Traitement Automatique du Langage. Trois grands axes de l'analyse linguistique et computationnelle seront abordés : la syntaxe, la sémantique, et la pragmatique/discours/dialogue.

Pré-réquis :

Apprentissage automatique

Description

  1. Introduction au TAL : principaux niveaux d’analyse (morphologie, syntaxe,  sémantique, pragmatique et discours) et présentation d’un panorama d’applications utilisant les techniques TAL.
  2. Analyse syntaxique
  3. Analyse sémantique  : sémantique lexicale et ressources lexicales, sémantique de la proposition
  4. Analyse discursive
  5. Outils statistiques pour le TAL
  6. Méthodes d’évaluation en TAL
  7. Applications

Compétences

Matière 2 : Ontologies - 3 ECTS - 20% C, 60% TD, 20% TPs

Responsable envisagé:

Laure Vieu

Objectifs :

Les ontologies, bases de connaissances génériques, permettent l’interopérabilité sémantique des systèmes, c’est-à-dire une interopérabilité qui dépasse l’adoption de standards syntaxiques en matière de langages de représentation et s’attache au contenu des connaissances génériques partagées. C’est pourquoi elles sont au coeur du développement du web sémantique, et que leur étude est désormais incontournable plus généralement en représentation des connaissances.

L'objectif de l'UE est de présenter les bases des travaux autour de cette notion et de donner les moyens théoriques et pratiques pour être capable d’analyser les ontologies existantes pour les sélectionner en vue d’une réutilisation, de les fusionner (alignement), et d’en construire de nouvelles. L’accent est mis sur les principes et les méthodes ainsi que sur la qualité des connaissances représentées afin de garantir la validité des inférences. Les langages standards du web sémantique sont présentés et pratiqués à travers le développement et la mise en oeuvre d’une ontologie.

Pré-réquis (changer de terme) :

Bases en logique du premier ordre.

Description

  1. Problématique du web sémantique et enjeux associés
  2. Définitions de la notion d'ontologie, de la discipline philosophique aux artefacts computationnels
  3. Principaux langages de représentation, de raisonnement et d'interrogation (logiques de description, standards du W3C)
  4. Bases formelles et méthodologiques pour la caractérisation d'ontologies bien fondées
  5. Méthodes de construction d'ontologies à partir de textes
  6. Alignement d’ontologies
  7. Manipulation et développement d’ontologies sur la plate-forme Protégé

Compétences :