Outils et formalismes linguistiques pour les systèmes
question-réponses avancés.
Intervenant : Patrick Saint-Dizier (IRIT, DR CNRS).
Durée: 3 heures environ a priori.
Outre les traitement à base de statistiques, et peut-être en complément de ceux-ci, les traitements à base de connaissances linguistiques permettent d'améliorer considérablement la qualité des systèmes question-réponses. Ils permettent aussi de développer d'autres types de questions, en dehors des questions factoides, pour lesquelles les traitements linguistiques sont cruciaux, en raison de la complexité des formes de langue à traiter. On peut citer dans cette dernière classe les questions en comment (questions procédurales), en pourquoi (questions sur les causes ou les conséquences) et certaines formes de questions sur les opinions.
Le tutoriel que nous proposons introduira les aspects suivants:
-
analyse de la question: identification de son type, du focus, des
contraintes,
- les défis et les techniques d'appariement entre
question et réponses candidates:
- traitement des entités
nommées, collocations, ambiguités,
- expansions sur critères
ontologiques,
- variations lexicales et syntaxiques,
- représentations à base de dépendances,
- introduction de quelques
relations rhétoriques (résumés, développements, etc.),
- formes
logiques et inférences.
- méthodes et techniques de segmentation de la
question et des textes,
- grammaires de textes (recherche de
structures globales dans des textes par rapport à un type particulier
de question: recherche d'un but pour les questions procédurales),
-
techniques de génération d'une réponse à base de patrons prédéfinis.
-
quelques cas de situations linguistiques complexes (anaphores, longues
distances entre fragments d'informations, ellipses, exceptions, etc.),
les road-maps.
Seront abordés des aspects linguistiques autour des marques
linguistiques, de l'analyse syntaxique, et d'éléments simples de
représentations conceptuelles de fragments de textes. Nous
présenterons aussi un prototype simple du système TextCoop: analyseur
de textes pour répondre à des questions procédurales. Outre sa
présentation, nous évoquerons les problèmes soulevés par l'évaluation
de systèmes question-réponses complexes.
|