Cours Ingenierie des connaissances
Cours de DEA/DESS sur l'ingénierie des connaissances
développé par Jean Charlet et Nathalie Aussenac-Gilles
Contexte
Nous proposons ici le support (les transparents) d'un cours d'Ingénierie
des connaissances. Il a été développé durant
les années 1999-2001 par Nathalie Aussenac-Gilles et Jean Charlet
pour des cours donnés, respectivement, au DEA en Représentation
des Connaissances et Formalisation du Raisonnement de l'université
de Toulouse 2 et au DESS d'Intelligence Artificielle de Paris VI. Bruno
Bachimont (3,4) et Philippe Laublet (3) ont aussi participé à
l'élaboration de certains des modules de ce support. Des supports
de cours de Monique Slodzian et Didier Bourigault nous ont aussi aidé
à mettre au point la partie sur la terminologie du module Ontologies
(3).
Les différents modules dans lesquels se répartit le contenu
des supports de cours sont disponibles sous la forme de fichiers PDF (dont
les liens sur la table des matières rappelée dans les entêtes
sont actifs pour certains ? si le formateur d'origine du support est LaTeX).
Engagements
L'ensemble du cours a une cohérence globale développée
ci-dessous (
cf. infra) mais chacun des modules se veut autonome
pour peu que les étudiants aient les connaissances de base nécessaires.
Chaque module correspond à un cours de 3-4 heures selon l'accent
qui peut être mis sur tel point ou telle application ou exemple (2
heures en cas de survol rapide). L'ensemble du cours (environ 260 transparents,
en l'état des modules développés) est destiné
à être présenté en 15-18 heures. Les auteurs
tiennent à attirer l'attention des lecteurs sur 3 points :
-
Chacun des modules forme un tout indivisible et la présentation
des seuls extraits d'un module est déconseillée au regard
des incompréhensions que cela peut provoquer.
-
Ces transparents sont réputés appartenir aux auteurs. Il
ne peut en être fait aucun usage commercial, de formation ou de présentation
en dehors de cours présentés dans le cadre de l'enseignement
public supérieur.
-
Dans ce dernier cas, les auteurs demandent à être prévenus
par courriel de toute utilisation motivée de ces supports pour pouvoir
exercer leurs droits.
Enfin...
-
Ces cours sont en constante modification pour mieux coller aux évolutions
d'un domaine de recherche encore très jeune. Des corrections, nombreuses,
et des extensions sont déjà prévues (cf. infra).
Toutes remarques ou critiques (même positives) sont les bienvenues.
Organisation du cours
-
Introduction (1) [50t] <IC-Introduction99> (voir le pdf)
: introduction à l'Ingénierie des connaissances, ses modèles,
ses concepts, ses problèmes et ses champs d'application. Cette introduction
pointe sur 1 exemple qui sera repris au long du cours, le projet MENELAS.
-
MENELAS (1c) [15t] <IC-IntroMenelas99 > (voir le pdf)
: présentation du système MENELAS de reconnaissance du langage
naturel dans le domaine des comptes rendus d'hospitalisation liés
à des opérations cardio-vasculaires. Son indépendance
par rapport à l'introduction permet de réutiliser et faire
vivre cet exemple dans une grande partie de l'exposé, en particulier
par rapport aux ontologies.
-
Modélisation (2) [40t] <IC-Modelisation00> (voir le pdf)
: Historique de la modélisation des connaissances en IA, plus particulièrement
en IC. L'approche d'acquisition des connaissances, conduite par les modèles,
est étudiée, en particulier l’utilisation du modèle
conceptuel dans un cycle complet d'acquisition des connaissances. La
méthode KADS sert d'exemple et est comparée à d'autres
méthodes comme MACAO par rapport au mode d'élaboration dumodèle
conceptuel, descendant versus ascendant.
-
SADE (2b) [12t] <IC-ModelSADE00> (voir le pdf)
: développement de l'exemple du système SADE, application
juridique de recouvrement de créances sur prêts immobiliers.
Son indépendance par rapport à la modélisation permet
de réutiliser et faire vivre cet exemple dans une grande partie
de l'exposé, comme au niveau de l'introduction.
-
Opérationalisation/Validation (2c) [] <IC-OperValid00>
: en cours de développement
-
Ontologies, terminologies (3) [48t] <IC-Ontologies00> (voir le pdf)
: Historique de la notion d'ontologie. Motivations et différents
points de vue sur les ontologies. Développement d'exemples montrant
les problèmes autour de la construction d'ontologies et propositions
méthodologiques en mettant en avant la problématique de l'acquisition
des connaissances terminologiques à partir des textes et le choix
des corpus.
-
Bases de connaissances terminologiques (3b) [21t] <IC-OntoBCT99> (voir le pdf)
: exemple de l'approche GEDITERM.
-
SYNTEX (3c) [26t] <IC-OntoSyntex02> (voir le pdf): ce module, développé à partir
d'un tutoriel présenté à RFIA2002 par Didier Bourigault, présente des
Outils de traitement automatique des langues pour la construction
d'ontologies à partir de textes. Ces outils sont présents au sein de
la chaîne de construction d'ontologies à partir de corpus SYNTEX et
la problématique spécifique à cette tâche est discutée
-
Construction d'ontologies ŕ partir de textes : méthodes et outils (41t) <COT3-methode> (voir le pptf)
  un cours de 3h de niveau DESS ou 3A d'école d'ingénieur
-
Gestion des connaissances (4) [31t] <IC-GestiondC00> (voir le pdf)
: Définitions des concepts de la gestion des connaissances. Approfondissement
de la notion de support d'inscription et d'appropriation des connaissances.
Conséquences méthodologiques.
-
HOSPITEXTE/XML (4b) [43t] <IC-GestionHospiXML00> (voir le pdf)
: exemple d'uneapproche documentaire du dossier médical hospitalier,
replacée dans le contexte de la gestion des connaissances médicales.
Évolutions prévues
-
Introduction (1) : La fin du module pointe sur un certain nombre
de problématiques qui font ou peuvent faire l'objet d'un module.
Seuls les modules sur la modélisation, les ontologies et la gestion
des connaissances sont développés. Les autres modules ( e.g.génie
cognitif,
génie logiciel , travail coopératif,
logique,
ingénierie pédagogique, apprentissage) seront
développés en fonction du temps et des besoins, par les auteurs
ou d'autres personnes motivées. En attendant, les introductions
à ces modules,en particulier leur plan, restent embryonnaires et
liés à ces développements.
-
MENELAS (1b) : mettre en illustration la suite des étapes
sur un exemple simple.
-
Modélisation (2) : À réorganiser en fonction
du fait que les techniques de recueil de connaissances seront développées
dans le cours de génie cognitif et qu'il sera complété
par un module opérationalisation/validation.
-
Ontologies, terminologies (3) : compléter avec des exemples
d'utilisation pour de l'indexation.
-
Gestion des connaissances (4) : Développer les liens avec
la gestion et les processsus d'innovation dans les entreprises. Redévelopper
une partie plus outils/méthodes.