11es journées Ingénierie des Connaissances
Toulouse, Centre pour l’Unesco, 10–12 mai 2000
Textes écrits, rassemblés et mis en forme par P. Tchounikine, M.-C.Jaulent, A. Mille, J. Charlet et N. Aussenac-Gilles
IC enfin à Toulouse - 10 mai - 11 mai - 12 mai
Les journées
Ingénierie des connaissances de l'an 2000, organisées par
les laboratoires toulousains IRIT et ERSS, ont offert une cuvée
réussie et dynamisante pour la communauté scientifique du
domaine. Comme l’a rappelé P. Tchounikine (Lium, Le Mans), président
du comité de programme, dans sa rapide introduction à la
conférence, l’appel à communication avait déjà
été un succès puisque 58 soumissions ont été
proposées (30 retenues). P. Tchounikine avait demandé au
comité de programme de mettre en pratique la remarque faite par
Jacques Pitrat dans le bulletin AFIA N°37, c’est-à-dire d’appliquer
une méthode de relecture " disjonctive " (accepter un article qui,
même s’il est insatisfaisant sur certains points, présente
néanmoins - au moins - une idée réellement intéressante,
par opposition à une méthode plus " conjonctive "), ce qui
a conduit à l’acceptation de quelques articles atypiques mais intéressants
(et, de fait, lors de la conférence, ces articles ont conduit à
des échanges passionnants). L’accent a été ensuite
mis sur la vitalité de l’Ingénierie des connaissances (IC),
avec notamment l’apparition de 3 nouveaux thèmes (Intranet/Internet
et IC ", " systèmes d’information et IC " et " ingénierie
éducative "), mais également sur sa cohérence scientifique
: l’analyse des articles présentés montre que l’IC n’est
pas une juxtaposition de thèmes, mais bien une thématique
scientifique cohérente. Enfin, illustrant la maturité de
la discipline, 3 " conférences tutorielles " (affreux néologisme,
qui a été reproché au pdt du comité de programme
! adopté faute de mieux, est-t-il appelé à subsister
?) ont été proposées cette année, chacune proposant
une vision synthétique d’une thématique phare. Ce principe
de conférence tutorielle a été retenu comme une bonne
idée, associant à la fois une approche pédagogique
et une volonté de faire le point (avec une touche personnelle) sur
un domaine de recherche. Une autre originalité de cette édition
d’IC a été la part importante accordée aux réalisations,
à travers une session de démonstrations (20 logiciels ont
été montrés) et deux sessions parallèles sur
les réalisations.
C’est la " conférence tutorielle " de R. Teulier (CNRS, Cachan) qui a ouvert IC’2000. Intitulé " L’ingénierie des connaissances aujourd’hui : quels enjeux pour l’organisation ? ", l’exposé proposait une analyse historique et prospective de l’impact de l’IC sur les entreprises, en s’appuyant sur l’évolution parallèle des travaux sur les systèmes d’informations et sur les approches gestionnaires. Une série d’enjeux étaient clairement identifiés : continuer à construire une véritable ingénierie, réussir l’intégration dans les SI, conceptualiser les modes de travail et comprendre les impératifs organisationnels. La nécessité d’aborder ces enjeux en interaction avec les autres disciplines et ingénieries (assumer le carrefour pluridisciplinaire !) et l’importance des aspects collectifs étaient également soulignés. Cet exposé ne pouvait que titiller l’auditoire et le temps de discussion n’a pas permis de donner la parole à tous. Une série d’interventions a cependant permis d’insister sur le passage des problématiques individuelles aux problématiques collectives (P. Zaraté), sur le bouleversement introduit par le Web, qui s’impose à faible coût et dont il faut respecter les caractéristiques intrinsèques (P. Albert) ou encore sur le changement des usages, le problème de l’accès aux connaissances prenant le pas sur celui de la résolution de problèmes (P. Laublet).
Si le nombre d’articles
portant sur les méthodes de résolution
de problèmes s’est effectivement réduit par rapport
aux années précédentes, la session qui y était
consacrée n’en était pas moins intéressante. Le premier
exposé, " Une modélisation au niveau connaissance du raisonnement
à partir de cas " de B. Fuchs (IAE, Lyon 3) et A. Mille (LISI, Lyon
1) présentait une modélisation générique du
raisonnement à partir de cas, fondée sur des formalismes
de spécification et de décomposition de tâches, l’exemple
de la tâche de remémoration étant approfondi. Le second,
" Construire un Système à Base de Connaissances de type Tâche/Méthode
à l'aide de graphes conceptuels ", de F. Trichet, M. Leclère
et C. Choquet (IRIN, Nantes), présentait l’apport des graphes conceptuels
à la représentation des différents types de connaissances
(domaine et raisonnement) utilisés lors d’une modélisation
de type tâche-méthode, ce qui constitue une amélioration
notable de travaux antérieurs (l’architecture DSTM, présentée
à IC’98).
La pause repas ne se prolongea pas par une pause digestive puisque c’est la session " Epistémologie " qui attendait les participants. L’exposé de B. Morand (GREYC, Caen), " Processus de représentation et raisonnement abductif - Une approche expérimentale du cas des diagrammes " proposait une contribution à une approche expérimentale des phénomènes de représentation, en l’occurrence centrée sur la conception de diagrammes. Les diagrammes successifs produits lors d’un processus de conception sont considérés comme des " faits de conception " observables, dont les états successifs permettent d’étudier les opérations permettant de passer de l’un à l’autre. B. Morand note que l’approche expérimentale qu’il propose permet d’envisager l’instrumentation de l’étude de phénomènes de cognition, qui n’est cependant selon lui envisageable que par la conception d’un système mixte (homme-machine). Non moins conceptuelle, l’intervention de N. Balacheff, " Les connaissances, pluralité de conceptions. Le cas des mathématiques " (Leibnitz, Grenoble) proposait une réflexion sur la notion de connaissance. L’auteur insistait sur la coexistence possible, chez un élève, de structures apparemment contradictoires mais cohérentes dans des contextes différents de mises en œuvre. Du point de vue de la conception de systèmes d’apprentissage (qui est le contexte de cette étude), la notion d’" erreur " peut ainsi être vue comme le symptôme d’une connaissance dont le fonctionnement sort de son domaine de validité. D’un point de vue plus général, l’exposé mettait en évidence le problème que constitue le simple emploi du terme " connaissance ". Finalement, si certains regrettaient l’absence des problématiques de l’ " ingénierie ", la plupart des auditeurs furent fortement interpellés par cette présentation atypique mais passionnante.
Intitulée " Ontologies et hypertextes ", la session suivante proposait une première intervention de C. Desmoulins et M. Grandbastien (Loria, Nancy) intitulée " Des ontologies pour indexer des documents techniques pour la formation professionnelle ". L’exposé présentait comment la conception d’ontologies (ontologie générique de documentation, ontologie du domaine de documentation, ontologies domaines et ontologie pédagogique) permettait aux formateurs d’exploiter les documentations techniques numérisées directement proposées par des constructeurs automobiles. L’exposé suivant de T. Dechilly et B. Bachimont (INA, Paris) " Une ontologie pour éditer des schémas de description audiovisuels, extension pour l'inférence sur les descriptions ", proposait ensuite une contribution à l’instrumentation de l’indexation audiovisuelle. Celle-ci comprenait une méthode pour définir, à partir d'interprétations d’images et de la prise en compte du type d'informations qui y sont recherchées, une ontologie pertinente pour ensuite les indexer.
La dernière session de présentation de cette longue journée, consacrée à l’ingénierie éducative, regroupait des approches de conception d’hypermédia à vocation pédagogique. Les travaux proposés présentaient successivement " Une démarche de conception pour les hypermédia pédagogiques : l'enjeu d'une approche centrée sur l'information " (S. Crozat et P. Trigano – Heudiasyc, Compiègne), puis " La construction de cours hypermédia adaptés à l'apprenant par agencement de briques élémentaires " (N. Delestre – PSI, Rouen). Ces 2 exposés (tout comme celui de C. Desmoulins et M. Grandbastien précédemment) mettaient bien en évidence les liens entre l’ingénierie éducative et l’ingénierie des connaissances.
Enfin, la session démonstration
(organisée par B. Biebow) était alors proposée aux
participants, fatigués mais rapidement ragaillardis par un buffet
servi sur place. Si l’ergonomie de certains systèmes était
mise à mal (difficile de tester un logiciel un verre à la
main !), cette session (près de 20 démonstrations et 6 posters)
illustrait cependant l’ancrage " ingénierie " de la conférence.
Le soir, une visite
guidée de la ville permettait de contempler la place du Capitole,
d’apprendre pourquoi beaucoup d’églises de la région n’avaient
pas de transept ou encore l’histoire de la Basilique Saint-Sernin (qui
illustre la couverture des actes).
La journée a débuté par une conférence sur " Textes et ontologies " conjointement présentée par D. Bourigault (ERSS, Toulouse) et J. Charlet (AP-HP, Paris). Cette intervention avait pour objectif de refléter les points de vue et les réflexions menées depuis quelques années au sein du groupe Terminologie et Intelligence Artificielle (TIA). Le problème majeur de la discipline est de développer des méthodes pour construire des ontologies en sachant bien qu’il est impossible de délivrer des ontologies universelles. Dans le groupe TIA, une place particulière a été faite à la construction d’ontologies à partir de textes, plusieurs outils existant dans ce domaine. Les orateurs ont insisté sur la nécessité d’avoir des outils pour sélectionner, trier les termes pour que l’expert puisse les valider. Les orateurs ont présenté un thésaurus pour l’ingénierie des connaissances, le projet Th(IC)2. Ce projet constitue une alternative, complémentaire, au projet (KA)2 de la communauté internationale d’ingénierie des connaissances (cf. http://www.irit.fr/GRACQ). L’objectif étant de construire un thésaurus en français décrivant la recherche francophone dans le domaine de l’ingénierie des connaissances à partir d’un corpus d’articles provenant des conférences d’IC.
La discussion suscitée par le tutorial a tourné autour de la construction d’ontologies à partir d’autre chose que des textes et en particulier des aspects réutilisables. Une polémique existe entre ceux qui pensent que les ontologies peuvent être une partie réutilisable d’une conceptualisation et ceux qui sont irrités par ces idées de généricité et montrent, par exemple, que les outils syntaxiques ne sont pas réutilisables d’une langue à l’autre.
En prolongement, la session 5 était la première de deux sessions consacrées à la terminologie et l’acquisition de connaissances à partir de textes. Elle illustrait bien le caractère pluri-disciplinaire de l'ingénierie des connaissances. Le premier article, présenté par B. Biebow, informaticienne (LIPN, Paris) présentait les étapes du processus de modélisation à partir de textes. Le second article, présenté par J. Rebeyrolle, linguiste (ERSS, Toulouse), s’est intéressé à l’acquisition de connaissances à partir de textes lorsque aucun dictionnaire n’est disponible (utilisation de structures lexico-syntaxiques privilégiées comme les contextes définitoires et de marqueurs tels les marqueurs lexico-syntaxiques et les marqueurs typographiques et dispositionnels). Dans ces deux travaux, les résultats obtenus reposent sur une analyse linguistique menée sur un corpus constitué par le groupe TIA.
Deux aspects de l’évolution
du capital " connaissances " d’une entreprise
ont été évoqués au cours de la session 6. Le
premier article présenté par T. Tounkara (Lamsade, Paris)
concernait l’acquisition d’informations de l’environnement lorsque l’entreprise
est en état de veille technologique. Les auteurs ont proposé
une extension de la méthode MKSM (cette démarche prolonge
le problème de la capitalisation d’un patrimoine de connaissances
vers celui de l’évolution de ce patrimoine). L’intérêt
de ce travail était de montrer les lacunes des approches classiques
(comme par exemple la défaillance des processus de veille quant
à la représentation et la création de nouvelles connaissances).
Le deuxième article présenté par S. Moisan (Inria,
Sophia Antipolis) s’attaquait à la difficulté particulière
pour l’entreprise de gérer les connaissances contenues dans les
codes informatiques. Les auteurs proposent deux nouveaux moyens pour la
gestion opérationnelle des connaissances sur les codes (les livres
de connaissances et le pilotage des codes).
Après un repas
convivial et riche en discussions dans les locaux de l’Unesco, l’après-midi
est consacrée à des aspects plus opérationnels de
l’ingénierie des connaissances avec d’une part les langages formels
et d’autres part plusieurs expériences pratiques dans le domaine.
La session 7 était consacrée à la modélisation et la représentation de connaissances à l’aide d’objets. Les contributions ont mis en évidence qu’une modélisation directe dans un formalisme donné est très difficile. Le premier article présenté par A. Napoli (Loria, Nancy) était une proposition pour la représentation de structures dans un système de représentation de connaissances par objets. Il s’appuie sur des travaux effectués en reconnaissance des formes où les descriptions structurelles ont été étudiées pour l’appariement et la reconnaissance d’objets dans des scènes. Le deuxième article est présenté par J. Nobécourt (LIPN, Paris 13) sur Mdos : un langage semi-formel permettant une modélisation des connaissances sous forme de réseaux conceptuels, à la frontière entre l’extraction des primitives conceptuelles à partir des textes et le choix d’un formalisme. Le but étant d’aider un ingénieur dans sa tâche de modélisation, appliquée dans le domaine de la supervision de réseaux de télécommunication. Le dernier article de la session est présenté par X. Cregut (ENSEEIHT, Toulouse) sur la modélisation et la réutilisation de composants de procédés (intégration dans l’environnement Rhodes, un environnement d’assistance pour la description et l’exécution de processus de conception et gérant des procédés en s’appuyant sur la technologie des composants).
Un point méthodologique
fort de l’ingénierie des connaissances qui s’impose dans les applications
présentées en session 8 est le recueil et la capitalisation
des connaissances à partir d’expériences concrètes.
Ces expériences peuvent être des observations directes fournies
par l’expert ou par des documents ou déjà des connaissances
explicitées par l’expert. Un autre point méthodologique abordé
a été la validation des modèles de connaissance. Les
domaines d’applications concernés par ces expériences pratiques
sont divers (domaine médical, agricole, accidents de la route, feux
de forêts, contrôle en temps réel). On a pu remarquer
qu’il s’agissait de domaines d’application pour lesquels la prise de décision
était souvent peu formalisée, reposant sur l’expérience
accumulée des experts.
À l’issue de
cette session, nous avons été conviés par N. Aussenac-Gilles
à nous rendre à la mairie de Toulouse où l’adjoint
au maire, autour d’un cocktail, a fait une allocution remerciant les organisateurs
et les participants de la conférence d’avoir choisi cette belle
ville de Toulouse pour leurs échanges fructueux. La soirée
s’est poursuivie à l’hôtel d’Assezat, joyaux de la renaissance
toulousaine, avec la visite du musée et une dégustation de
vins régionaux.
C’est la conférence tutorielle " Gestion des connaissances ", présentée par J.-L. Ermine (CEA, Saclay) qui a ouvert la journée. Ce principe de conférence tutorielle est une bonne idée, associant à la fois une approche pédagogique et une volonté de faire le point sur un domaine de recherche. L’exposé très clair, synthétique et pédagogique manquait peut-être un peu d’ouvertures vers des voies de recherche précises et prometteuses. Mais on ne saurait trop recommander à ceux qui démarrent dans le domaine de la gestion des connaissances de commencer leur lecture par les travaux présentés ici. Les questions ont permis d’aborder des concepts comme " l’intelligence émotionnelle ", (intelligence de comportement ou de l’être) dans le partage et la transmission de connaissances, tandis que les différences d’approche américaine et européenne étaient distinguées – on met en place les outils et on attend de voir ce qu’il en ressort, versus on réfléchit sur les connaissances, les modes d’organisation et on instrumente avec des outils. L’expérience de l’intranet chez les professionnels a fait ressortir que les clés de réussite de mise en œuvre sont : 1/3 d’organisation, 1/3 de changement et 1/3 d’outils. Enfin, la façon de prendre en compte et de représenter le contexte a été discutée du point de vue de l’ingénierie des connaissances.
La fin de matinée a été consacrée à la session 9, " Gestion des connaissances " qui a commencé par un exposé dont le titre " Gérer les retours d’expérience pour maintenir une mémoire métier, étude chez PSA Peugeot Citroën " (A Faure – PSA, La Garenne Colombes – et G Bisson – INRIA, Rhône-Alpes), résonnait particulièrement bien avec la conférence tutorielle. Il s’agissait en effet de gérer l’accès aux documents contenant les connaissances métier de façon à en améliorer la persistance et la réutilisation. La discussion a démontré que cette démarche, pragmatique au départ, a nécessité de modéliser les connaissances sous forme d’un référentiel métier, présenté selon 4 points de vue inspirés de MKSM. Toutefois si les documents métiers ont été analysés par un groupe de travail constitué de chefs de service, il n’y a pas eu d’interviews des utilisateurs ou des auteurs des documents. Une façon d’assurer le passage réciproque d’une ontologie à une base documentaire par un " cycle vertueux " a été présentée dans l’exposé suivant, " Construction et exploitation d’une ontologie pour la gestion des connaissances d’une équipe de recherche " de G. Kassel (Laria Amiens), M.-H. Abel, C. Barry, P. Boulitreau, C. Irastroza, S. Perpette. Il s’agissait en effet de pouvoir expliquer les documents par des connaissances et réciproquement illustrer des connaissances par des documents qui les présentaient. La session s’est terminée par l’exposé " Ingénierie de la coopération pour gérer les connaissances dans une entreprise étendue ", par I. Boughzala, M. Zacklad et N. Matta (TechCico, Troyes), qui s’est attaché à montrer que le problème de la communication de connaissances et de la coopération entre partenaires impliqués dans une entreprise étendue était particulièrement important. La question du support de communication EDI-Web a peut-être été un peu rapidement évoquée. Les aspects organisationnels ont été majeurs dans cet exposé intéressant mais pas toujours accessible pour les auditeurs.
La session 10, " Système d’information et ingénierie des connaissances " a débuté par l’exposé " Ingénierie des besoins, ingénierie des connaissances : similarités et complémentarités des approches de modélisation " de F. Tort (ENS, Cachan), R. Teulier, G. Grosz et J. Charlet, qui comparait EKD (méthode développée à l’occasion du projet Elektra) à CommonKads. EKD, piloté par les objectifs et les changements, a permis de modéliser des aspects importants de l’entreprise et des besoins qui s’y exprimaient. CommonKads s’attache plus à mettre en évidence le triplet Contextes/Concepts/Artefacts. Les deux approches sont capables de représenter l’amont, le contexte de l’entreprise et la réutilisation des connaissances. Le second exposé de cette session " Extraction et intégration d’informations semi-structurées dans des pages Web, Projet Chimère ", par M.-S. Seget (LIRMM, Montpellier), P. Pompidor et D. Hérin, s’est intéressé à la récupération des pages Web issues de sites d’offreurs de services (train, hôtel). L’objectif final est de tester automatiquement les offres de service. Pour cela, le système (robot) induit une ontologie locale à chaque serveur conforme à une ontologie globale fabriquée. Cette ontologie doit permettre de remplir automatiquement le formulaire ainsi découvert. Le problème est très intéressant mais les difficultés semblent impressionnantes et la recherche menée pour les surmonter commence tout juste.
Une deuxième
et dernière session consacrée à " Terminologie
et acquisition de connaissances " est venue clore la conférence.
L’exposé d’ouverture " Partage des termes, partage des connaissances
? Construire une modélisation unique de plusieurs corpus ", proposé
par les linguistes M.-P. Jacques et A.-M. Soubeille (ERSS, Toulouse), présentait
une étude sur 4 institutions qui essayaient d’harmoniser leurs termes
et leurs connaissances. Les termes et les relations lexicales sont issus,
selon une analyse linguistique, du corpus de chaque institution et ont
servi de départ à la construction d'une ontologie. Une tentative
de fusion des 4 ontologies a été menée. Sur 700 concepts
repérés, 4 seulement se sont révélés
parfaitement identiques et une quarantaine proches. Il semble à
l’évidence que l’effet de contexte joue très vite et que
les efforts à faire pour rapprocher des usages de termes ont été
vite impressionnants. Le second exposé de la session s’intitule
" Relations morphologiques et structuration de terminologie ", P. Zweigenbaum
et N. Grabar (AP-HP, Paris), abordait l’apprentissage sur des couples de
mots pour découvrir des relations morphologiques. Nous avons interprété
les résultats principaux du travail comme capables d’améliorer
sensiblement l’étiquetage des relations de référence
(celles qui donnent un sens). Il s’agirait alors d’une amélioration
importante de l’indexation dans les thésaurus. Le dernier exposé
" Apport de la fouille de données textuelles pour l’analyse de l’information
", Y. Toussaint, A. Simon et H. Cherfi (LORIA, Nancy) illustrait une autre
approche des textes, non plus basée sur leur étude linguistique
mais sur leur exploration selon des critères statistique d'usage
des termes. Les résultats de ces analyses (ici des classes au sens
des treillis de Galois et des règles d’association) ont pu être
interprétés par des experts pour faire de la veille scientifique
sur de grosses quantités de documents techniques.
On pourra trouver, sur le site GRACQ (http://www.irit.fr/GRACQ/), les articles de la conférence in extenso (très prochainement), le présent compte rendu, ainsi que la description et les exposés des différentes journées co-organisées en 1999 et 2000 par le GRACQ et accompagnant la politique d’ouverture de la conférence IC. La conférence vous donne rendez-vous au sein de la plate-forme AFIA pour son édition 2001.
Ont également participé à la rédaction de ce compte rendu : S. Delaitre, B. Fuchs, Y. Prié, J.-M. Héraud, P.-A. Champin, L. Damase.