TALN-2007

Traitement Automatique des Langues Naturelles : du 5 au 8 juin 2007 à Toulouse



Xerox Research Centre Europe
 Informations
 o Programme
 o Liste des papiers acceptés
 o Inscription
 o Comment venir
 o Logement
 o Posters & présentations
 TALN
 o Appel à com.
 o Comité de programme
 o Comité scientifique TALN
 o Comité d'organisation local
 o Soumettre un papier à Taln
 o Feuilles de styles
  RECITAL
 o Appel à com.
 o Comité scientifique
 o Comité d'organisation local
 o Soumettre un papier à Recital
 o Feuilles de styles
 Ateliers
 o Traitement Automatique des Langues des Signes
 o Formalismes syntaxiques de haut niveau
 o Reconstruire la langue dans les communications alternatives et augmentées 

 Tutoriels
 o Outils et formalismes linguistiques pour les systèmes question-réponses avancés
 Organisation





Outils et formalismes linguistiques pour les systèmes question-réponses avancés.

Intervenant : Patrick Saint-Dizier (IRIT, DR CNRS).
Durée: 3 heures environ a priori.

Outre les traitement à base de statistiques, et peut-être en complément de ceux-ci, les traitements à base de connaissances linguistiques permettent d'améliorer considérablement la qualité des systèmes question-réponses. Ils permettent aussi de développer d'autres types de questions, en dehors des questions factoides, pour lesquelles les traitements linguistiques sont cruciaux, en raison de la complexité des formes de langue à traiter. On peut citer dans cette dernière classe les questions en comment (questions procédurales), en pourquoi (questions sur les causes ou les conséquences) et certaines formes de questions sur les opinions.

Le tutoriel que nous proposons introduira les aspects suivants:

  • analyse de la question: identification de son type, du focus, des contraintes,
  • les défis et les techniques d'appariement entre question et réponses candidates:
    • traitement des entités nommées, collocations, ambiguités,
    • expansions sur critères ontologiques,
    • variations lexicales et syntaxiques,
    • représentations à base de dépendances,
    • introduction de quelques relations rhétoriques (résumés, développements, etc.),
    • formes logiques et inférences.
  • méthodes et techniques de segmentation de la question et des textes,
  • grammaires de textes (recherche de structures globales dans des textes par rapport à un type particulier de question: recherche d'un but pour les questions procédurales),
  • techniques de génération d'une réponse à base de patrons prédéfinis.
  • quelques cas de situations linguistiques complexes (anaphores, longues distances entre fragments d'informations, ellipses, exceptions, etc.), les road-maps.

Seront abordés des aspects linguistiques autour des marques linguistiques, de l'analyse syntaxique, et d'éléments simples de représentations conceptuelles de fragments de textes. Nous présenterons aussi un prototype simple du système TextCoop: analyseur de textes pour répondre à des questions procédurales. Outre sa présentation, nous évoquerons les problèmes soulevés par l'évaluation de systèmes question-réponses complexes.



Dernière mise à jour :  Wed Oct 22 11:21:03 2008