Traitement de Langages et Dialogues Naturels par Ordinateur
Philippe Muller
Cours de niveau 3e cycle.
Pré-requis: logique du premier ordre et calcul lambda élémentaire.
Avec l'avènement du web, l'individu et la machine ont un accès
quasi illimité à toutes sortes de textes et à une
multitude d'autres individus et machines avec qui
communiquer par le biais de textes. Encore faut il
que l'on sache exactement comment les individus
communiquent et comment conférer à des machines
des capacités semblables. L'homme pense, il écrit
et lit mais la machine calcule. Peut on simuler
quelques capacités de communication aux moyen de
calculs "simples" ? Si l'on se limite dans nos
ambitions, la réponse est catégoriquement que
oui.
Toute la difficulté de compréhension et de production de textes
réside dans un ensemble de modèles et techniques
qui sont apparus progressivement à la communauté
de l'informatique linguistique. On a cru que des
mots clés suffiraient (la recherche sur le web
exploite cette technique). Il a fallu tenir compte
de la forme syntaxique des contenus textuels
pour construire des représentations sémantiques
plus élaborées.
Le discours et le dialogue ont exigé des raisonnements sur le contexte
discursif et dialogal de l'acte communicationnel
(la pragmatique, la rhétorique).
Nous proposons de présenter dans ce cours une approche cohérente à
plusieurs de ces phénomènes. Nous ferons ainsi
d'emblée usage de formalismes grammaticaux récents
(grammaires d'unification) et ferons le lien avec
les techniques de représentation de l'information
contenue dans des textes.
Transparents pour l'année 2004-2005 (4h)
Le cours complet (pdf)
Transparents pour l'année 2003-2004 (6h+2h TP)
- Intro :
- domaines concernés (IA, linguistique, philo)
- pour quoi faire: les applications
- interface IHM (vocale, base de données, etc)
- traduction automatique
- génération de textes, résumé automatique
- recherche d'information et indexation
- pourquoi ? les problèmes (du mot à mot en MT, de l'approche par
mots-clés, ...)
ex de problème: ambiguité (à tous les niveaux)
- méthodes: symboliques, nuémriques, hybrides
- Les niveaux d'analyse:
- les mots: le lexique
- la structure: la syntaxe
- le sens: la sémantique
- le contexte: la pragmatique
le pb fondamental: passer de la surface (mots) a une representation du sens
en contexte. pour cela, considérer la syntaxe comme une structuration
du sens, par un processus de traduction (formelle)
en théorie permet le sens contraire (génération)
- L'analyse syntaxique
- le problème: structure des phrases
- grammaticalité, analyse en constituants.
- syntaxe et langages formels: automates
- syntaxe et langages formels: CFG
- premier exemple de grammaire (française)
- analyse de CFG (top-down, bottom-up, left corner, plus si le temps)
complétude, correction, complexité, ...
- insuffisance expressivité des CFG simples: traits syntaxiques
- structures de traits, unification, grammaires d'unifications
- ex: GPSG, et une deuxième grammaire simple du français
- L'analyse sémantique
- interprétation dépend de la structure: règles de correspondance
- ex. simple: passage d'attributs dans grammaire d'unification
- ex. plus complexes: LFG, HPSG,
-> théories sémantiques (C-structures en LFG, soa en HPSG)
- un formalisme plus général: logique et lambda-calcul
- un ex. de traduction en logique, avec une sémantique simple
(cf. le livre de Blackburn et Bos)
- exercice: grammaire et DCG, vive prolog.
- Au delà de la phrase:
- la pragmatique (présupposés, implicatures)
- le discours (ordre temporel, structuration thématique)
- le dialogue: la syntaxe, le pb de l'interaction,
- retour sur les applis: théorie et pratique
Philippe MULLER muller--at--irit.fr