https://www.irit.fr/TIA09/image/image%20toulouse%202.JPGlogo-tia12009

8ème  conférence internationale Terminologie et Intelligence Artificielle - Toulouse (France), 18-20 Novembre 2009

 

 

 


Avant-propos

Rose Dieng, Directrice de Recherches à l'Inria, a été la responsable de l'organisation de TIA'07 à Nice.  Membre actif et dynamique du groupe TIA depuis ses débuts, elle était très attachée à la pérennisation des journées TIA. Elle nous a quittés le 30 juin 2008 et nous manquera cruellement pendant ces rencontres à Toulouse. Ces 8e journées sont dédiées à sa mémoire.

Depuis 1995, les conférences Terminologie et intelligence artificielle (TIA) ont placé au cœur de leur réflexion la confrontation des paradigmes de la terminologie et de l’ingénierie des connaissances. Cette confrontation a permis de faire converger l’acquisition des connaissances à partir de textes et leur modélisation formelle dans différents supports et de se focaliser sur les conséquences théoriques, méthodologiques et applicatives soulevées par ces tâches. En mettant l’accent sur les textes et l’étude des diverses modalités selon lesquelles les connaissances y sont exprimées, les conférences TIA se sont rapidement distinguées d’autres événements portant sur des thématiques apparentées.

Dans tous les domaines, les documents sont porteurs de connaissances et servent de support à leur mémorisation et à leur transmission. La gestion des documents (classement, pertinence face à une requête, etc.), l'acquisition et l'extraction des connaissances en vue d'indexation, de modélisation ou de conceptualisation s'appuient parfois sur des études terminologiques et linguistiques. Ainsi la terminologie et la linguistique fournissent des clefs essentielles à d'autres disciplines comme le traitement automatique des langues, les sciences de l’information et l’ingénierie des connaissances. En retour, ces disciplines soulèvent de nouveaux problèmes et ouvrent des perspectives inédites. Depuis une quinzaine d'années, les conférences TIA sont un lieu d'échanges entre des chercheurs de ces différentes disciplines.

D’abord animées par un groupe portant le même nom (groupe TIA : http://tia.loria.fr/), les conférences TIA se sont tenues successivement à Paris (TIA’95 : Villetaneuse), à Toulouse (TIA’97), à Nantes (TIA’99), à Nancy (TIA’01), à Strasbourg (TIA’03), à Rouen (TIA’05) et à Nice (TIA ’07). Fondé sous l’égide de l’Association Française d’Intelligence Artificielle (AFIA) en 1994, devenu groupe AFIA/GdR-I3, TIA a rassemblé des chercheurs en linguistique, en traitement automatique des langues et en ingénierie des connaissances. Bien que les conférences se soient toujours déroulées en France, elles ont rapidement attiré l’attention et soulevé l’intérêt de chercheurs ailleurs dans le monde travaillant sur les thématiques déployées par TIA. Le groupe TIA n’existe plus en tant que tel, mais a évolué pour former le comité de pilotage de la conférence TIA 2009.

Cette année, le comité de programme de la conférence a voulu mettre l’accent sur les termes, leurs réalisations dans les textes ainsi que sur les structures terminologiques. Les termes sont utilisés dans de nombreuses applications comme pivots de la structuration des connaissances : les ontologies, les thésaurus documentaires et autres ressources terminologiques plus classiques comme les dictionnaires spécialisés et les bases de données terminologiques. Entre les termes, on dégage un nombre plus ou moins élevé de relations sémantiques. Or, si toutes les applications citées ci-dessus se caractérisent par la recherche d’une certaine stabilité, la nature linguistique des termes et des relations dans lesquelles ils entrent soulève de nombreuses questions. Quelles relations représenter en fonction de l’application ? Comment représenter les termes ainsi que les relations dans lesquelles ils se trouvent ? Comment lier les relations représentées dans les ressources terminologiques et leurs réalisations linguistiques dans les textes ?

Poursuivant la tradition engagée en 1995, TIA 2009 veut être une tribune pour tous les travaux fondamentaux, méthodologiques et applicatifs gravitant autour des questions liées aux travaux de recherche en ingénierie des connaissances dans lesquels la linguistique textuelle joue un rôle important. Un accent particulier est mis sur la recherche multidisciplinaire faisant converger les champs d’intérêts de l’ingénierie des connaissances, de la linguistique, de la terminologie, des sciences de l’information, du traitement automatique des langues, etc. Ainsi, dans la sélection des articles, nous avons mis un accent particulier sur la diversité des interventions, leur intérêt quant à la réflexion engagée il y a déjà un peu plus d’une décennie sur les liens partagés par le texte et la représentation des connaissances dans des supports formels, ainsi que sur les études et expériences concrètes permettant de mieux comprendre le rôle du terme comme véhicule des connaissances spécialisées.

En sollicitant des propositions de communications portant sur des théories sémantiques ou la terminologie par rapport à la linguistique textuelle et aux ontologies (notamment, les approches linguistiques théoriques visant à caractériser le terme ou les structures terminologiques), le comité de programme a souhaité poursuivre une réflexion essentielle autour de questions fondamentales.

En outre, la conférence se veut un lieu de discussion sur des questions méthodologiques et théoriques portant sur la représentation des termes et des relations sémantiques ou conceptuelles dans des structures de données spécifiques (ontologies, thésaurus, etc.); la représentation des termes et des relations dans les applications multilingues; la confrontation de terminologies, des ressources terminologiques et des ressources ontologiques provenant de langues, de communautés, de périodes différentes; l’étude de problèmes théoriques et techniques liés à la constitution automatique ou manuelle de terminologies à partir de corpus mono ou multilingues; l’étude des liens entre ontologies et terminologies ou thésaurus (exploitation de terminologies pour la constitution et la structuration d’ontologies). Les propositions portant sur l’automatisation partielle ou complète de l’acquisition ou de la représentation des connaissances ont été  également invitées, plus précisément, les méthodes de structuration automatique de terminologies; l’identification de relations entre termes, la répartition en domaines, l’apport de la formalisation ontologique à l’explication de la sémantique de thésaurus et de terminologies). Les questions de l’évaluation et de la validation de terminologies; les difficultés liées à la constitution de terminologies multilingues; la réutilisabilité, la standardisation, la comparaison et la fusion de ressources terminologiques ou ontologiques, ont également toujours été au cœur des préoccupations des conférences TIA. Enfin, le contexte applicatif des travaux visant la modélisation des connaissances devait être mis en évidence : les applications exploitant des ressources terminologiques, comme le web sémantique, la gestion de flux documentaires, la recherche d’information, la classification de documents, la veille technologique, les question-réponse, etc.

L’appel du comité de programme a été entendu puisque 32 articles ont été soumis au comité de programme. Le caractère international est particulièrement marqué cette année. Les soumissions viennent de lieux aussi divers que la Belgique, le Canada, la Chine, la Croatie, l’Espagne, les États-Unis, la France, l’Italie, le Portugal et le Royaume-Uni. Cette diversité a également comme corollaire une représentation conséquente des travaux portant sur des langues variées.

Nous avons sélectionné 13 articles en présentation orale et 11 comme posters. Les communications portent sur : l’annotation des corpus spécialisés ou généraux en vue d’applications spécifiques; l’élaboration d’ontologies ou de thésaurus dans des domaines comme la médecine, la céramique, l’alimentation, le bâtiment, l’environnement; l’étude des propriétés linguistiques des termes à partir de corpus (la polysémie, la réduction des termes complexes, par exemple); des dénominations d’une nature particulière, comme les désignations commerciales, les marqueurs de relations sémantiques ou conceptuelles (cette dernière thématique faisant l’objet d’un atelier), l’image comme support conceptuel, des applications comme la catégorisation automatique de documents, l’élaboration de ressources terminologiques riches (contenant des définitions formalisées ou des liens entre termes); l’extraction de termes (et de collocations).

            Outre les articles sélectionnés par le comité de programme, TIA 2009 accueille deux conférenciers invités dont les interventions permettront d’enrichir la réflexion sur les méthodes de repérage de connaissances et d’analyse sémantique en corpus.

La première conférence invitée est présentée par Diana Maynard et s’intitule « GATE : Bridging the Gap between Terminology and Linguistics ». La présentation décrit la plateforme GATE et ses composants et la diversité de ses utilisations tout en explicitant ses fondements.

La seconde conférence invitée présentée par Carlos Subirats et intitulée « Spanish FrameNet. An On-line Lexical Resource and its Application to NLP », fait un bilan de l’élaboration de la version espagnole de la ressource lexicale FrameNet, de sa méthodologie et de ses applications au traitement automatique des langues.

Cette année, deux ateliers thématiques sont associés à la conférence proprement dite. Dans les deux cas, les liens entre textes et connaissances sont mis en évidence. Le premier, intitulé « Du thème au terme. Émergence et lexicalisation des connaissances », s’intéresse aux travaux permettant de mieux comprendre le processus d’apparition de nouveaux concepts. Le second, intitulé « Acquisition et modélisation de relations sémantiques », se focalise sur des aspects essentiels de l’analyse des relations sémantiques dans les corpus spécialisés, c’est-à-dire comment les repérer dans les textes et comment les représenter dans différents types d’applications.

TIA 2009 n’aurait pu avoir lieu sans le concours et soutien de nombreuses personnes à qui nous aimerions rendre hommage. D’abord, nous aimerions remercier les deux organisatrices de l’événement, Nathalie Aussenac-Gilles et Anne Condamines, dont la présence infaillible et les nombreux conseils ont grandement facilité la gestion des multiples tâches reliées à la préparation de la conférence. Les deux présidentes du comité d’organisation ont également pu compter sur une équipe composée de membres de l’IRIT (Institut de Recherche en Informatique de Toulouse) et du CLLE-ERSS (Cognition, Langues, Langage, Ergonomie-Equipe de Recherche en Syntaxe et Sémantique). Pour la première fois, deux ateliers distincts sont associés à TIA et nous aimerions adresser nos sincères remerciements à leurs organisateurs – Sylvie Després, Natalia Grabar, Monique Slodzian et Mathieu Valette – pour avoir sollicité des articles portant sur des thématiques plus spécifiques et pour avoir pris en charge l’organisation des deux événements.

.Nous aimerions également remercier les membres du comité de programme dont les avis et les nombreux commentaires ont mené à l’élaboration d’un programme aussi riche. Nous adressons des remerciements sincères à Diana Maynard et à Carlos Subirats pour avoir accepté de préparer une conférence invitée sur des thématiques intéressant les participants à TIA.

Enfin, l’organisation des deux journées de la conférence et de la journée consacrée aux ateliers a reçu le soutien financer des organismes suivants : le Conseil Régional de la Région Midi Pyrénées, le Conseil National de la Recherche Scientifique (CNRS), l’Université Paul Sabatier Toulouse 3, l’Université Toulouse 2 le Mirail, l’Institut National en Informatique et Automatique (INRIA), la Délégation Générale à la Langue Française et aux Langues de France (DGLFLF), CFH : Facteurs humains et ingénierie Linguistique. Enfin, le parrainage scientifique est assuré par l’AFIA et le GDR I3.

 

Comité d’organisation

Responsables

Nathalie Aussenac-Gilles (IRIT, Toulouse) aussenac@irit.fr

Anne Condamines (CLLE-ERSS, Toulouse) anne.condamines@univ-tlse2.fr

 

Membres

 

Françoise Agar (IRIT, Toulouse)

Jean-Pierre Bariteau (IRIT, Toulouse)

Ludovic Chacun (IRIT, Toulouse)

Jean-Philippe Cornille (IRIT, Toulouse)

Véronique Debats (IRIT, Toulouse)

Corinne Doumerc (IRIT, Toulouse)

Nathalie Duhaut (CLLE-ERSS, Toulouse)

Sabyne Lartigue (IRIT, Toulouse)

Stéphanie Lopez (CLLE - ERSS, Toulouse)

Christine Pernet (CLLE - ERSS, Toulouse)

Aurélie Piction (CLLE-ERSS, Toulouse)

Sophie Rességuier (IRIT, Toulouse)

Bernard Rothenburger (IRIT, Toulouse)

Anis Tissaoui (IRIT, Toulouse)

 

Comité de programme

 

Présidentes

 

Marie-Claude L’Homme (OLST, Université de Montréal

Sylvie Szulman (LIPN, Université Paris XIII)

 

Membres

 

Guadalupe Aguado (Universitad Politécnica de Madrid, Espagne)

Amparo Alcina (Universitat Jaume-I, Espagne)

Nathalie Aussenac-Gilles (IRIT, France)

Caroline Barrière (NRC, Canada)

Olivier Bodenreider (National Library of Medicine, USA)

Maria Teresa Cabré (Universitat Pompeu Fabra, Spain)

Marc van Campenhoudt (Université de Bruxelles, Belgique)

Farid Cerbah (Dassault-aviation, France)

Jean Charlet (AP-HP & INSERM, France)

Anne Condamines (CLLE-ERSS, France)

James Cussens (University of York, UK)

Lyne Da Sylva (EBSI, Montréal, Canada)

Valérie Delavigne (Institut national du cancer, France)

Patrick Drouin (OLST, Montréal, Canada)

Pamela Faber (Universidad de Granada, Espagne)

Ulrich Heid (Universität Stuttgart, Allemagne)

Fidelia Ibekwe-SanJuan (Université Lyon-3, France) 

Kyo Kageura (University of Tokyo, Japan)

Adeline Nazarenko (LIPN, Université Paris 13)

Pascale Sébillot (IRISA, France)

Koichi Takeuchi (Okayama University, Japan)

Rita Temmerman (Erasmushogeschool, Belgique)

Yannick Toussaint (LORIA, France)

Pierre Zweigenbaum (LIMSI-CNRS & CRIM-INALCO, France)