Thèmes de recherche

Les activités de recherche de TerrNet se répartissent en plusieurs thèmes centrés sur l'utilisation des propriétés de petits mondes hiérarchiques des graphes de terrain pour explorer ce qui dans leur structure permet de modéliser des aspects de la cognition et de la sémantique.

 

Métrologie des réseaux lexicaux:

L'objectif du thème de recherche métrologie est de développer des outils pour l'étude et la manipulation des réseaux de terrain. La conception de ces mesures est un travail de recherche visant à mieux comprendre les phénomènes modélisés par ces réseaux, et leur développement sert à répondre aux besoins propres des projets expérimentaux et applicatifs de l'équipe TerrNet : Reflex, Wisigoth, Kodex. Ces outils sont accessibles sous licence $licence$ et peuvent etre adaptés à d'autres besoins. Dans ce cadre nous avons défini plusieurs outils :

Modélisation

La plupart des graphes de terrain représentant des phénomènes du monde réel partagent des propriétés similaires de connectivité et de distribution des degrés, cependant, la génération artificielle de graphes possédant ces propriétés reste encore une question difficile. Nous proposons d'utiliser des marches aléatoires sur des graphes aléatoires pour créer des graphes dont la connectivité et la distribution des degrés sont semblables aux graphes de terrain. Article Random walks To Small Worlds (2010)

Comparaison de graphes

Deux graphes de terrains construits dans le but de représenter une même relation de terrain (par exemple deux dictionnaires de synonymie) présentent en général un accord faible entre leurs liens. Par exemple, deux mots synonymes pour un dictionnaire ne le sont souvent pas pour un autre. Nous proposons une méthode robuste de comparaisons de graphe non plus basée sur la seule comparaion locale de leurs liens, mais sensible à la topologie les environnant dans le graphe. Article TextGraph 2011

Clustering

Bien que peu denses, la plupart des graphes de terrains, sont formés de zones denses en liens. Ces zones denses identifient des familles de sommets qu'il est important de détecter, (par exemple les zones denses dans un réseau de d' accointances identifient les communautés). Un sommet peu appartenir à plusieurs zones denses, (par exemple dans un réseau de d' accointances un individu peut appartenir aux zones denses identifaint sa famille, son entreprise, son club de sport, son syndicat, …). Nous proposons des méthodes de clusterisation pour les réseaux de terrain avec recouvrement (un sommet peut appartenir à plusieurs clusters). Article FCA 2010

Visualisation/Navigation

Cette métrologie nous permet de modéliser les relations que les sommets des graphes de terrain entretiennent entre eux. En particulier, nous appelons proxémie une mesure de leur proximité que nous avons élaborée. La proxémie tire parti de la topologie du graphe pour modéliser les distances sémantique entre les unités de terrain représentées par les sommets d'un réseau. Elle permet ainsi de visualiser ces données dans leur contexte, dans une représentation fidèle à leur proximité sémantique mesurée par proxémie. Par analyse en composants principaux, les données multidimensionnelles sont projetées dans un espace à trois dimensions optimal. Cette visualisation permet d'explorer intuitivement les réseaux de terrain, comme illustré par l'application lexicale Naviprox. prox.irit.fr.

Article meaning small worlds 2008

Ergonomie de l'accès à l'information

Il s'agit dans ce thème de recherche de développer des interfaces d’accès à l’information (bases de données, dictionnaires, Web, …) adaptées aux fonctionnement du cerveau humain, tout comme par le passé ont été adaptés les outils à la morphologie de la main humaine. En pratique nous développons un système de présentation des réponses d'un moteur de recherche d'information qui permet d’informer l’utilisateur de l’existence des multiples points de vue sur sa requête relativement à la base documentaire interrogée. L’utilisateur peut alors en toute connaissance de cause préciser son choix selon les informations recherchées. Plusieurs mises en oeuvre de ce thème de recherche sont regroupées dans l'application Kodex.

Modélisation de l'acquisition lexicale

Nous cherchons à modéliser comment l’enfant acquiert et reproduit le lexique de sa langue maternelle, de quelques mots, puis quelques centaines, jusqu’à disposer du réseau lexical général d’un adulte. Ce thème de recherche est appliqué au sein du projet REFLEX.

Modélisation de la métaphore analogique

Il s'agit de comprendre pourquoi "déshabiller une banane" se comprend malgré une tension sémantique et ainsi de modéliser le fonctionnement de la métaphore analogique.

Un locuteur voulant communiquer un évènement A ex : [l’action de PELER une pomme] peut produire un énoncé conventionnel « peler une pomme » mais il peut aussi produire un énoncé métaphorique « déshabiller une pomme ». Selon Aristote, (Aristote, Poétique), la métaphore se bâtit à partir de l’analogie conceptuelle d’un quadruplet du type peler:pomme::déshabiller:poupée : le quadruplet conceptuel c1:c2::c3:c4 est analogique si le concept c1 entretient avec le concept c2 la même relation que le concept c3 entretient avec le concept c4 (c1 est à c2 ce que c3 est à c4) d’où peler:pommee::déshabiller:poupée est analogique, car le concept peler est au concept pomme ce que le concept déshabiller est au concept poupée.

L'application pratique, SLAM., de ce thème consiste à calculer automatiquement l'expression conventionnelle à partir de l'énoncé métaphorique comme par exemple :

« déshabiller une pomme » → « peler une pomme »

« les bras de l'arbre » → « les branches de l'arbre »

Desalle, Y., Gaume, B., and Duvignau, K. (2009). SLAM : Solution Lexicale Automatique pour Métaphore. in Traitement Automatique des Langues, 50(1) :161–182.

 

 

Français