Présentation des journées
Ces journées sont organisées à l'occasion des journées plénières du GDR IA, probablement entre le 23 et 26 novembre 2020.
Nous assistons aujourd’hui à une production de données structurées sans précédent, dont une grande partie est publiée sous la forme de graphes de connaissances (GC) accessibles via le Web de données. Ces GC tels que DBpedia, YAGO et Wikidata du côté académique, ou Google Knowledge Graph, Facebook Graph ou le Satori Knowledge Graph de Microsoft, côté industrie, décrivent des entités de nature diverse (telles que des personnes, des protéines ou des livres). Ces connaissances sont généralement exprimées en RDF (Resource Description Framework), représentant des faits tels que «Macron, présidentDe, France». Certains graphes de connaissances sont associés à des ontologies : des modèles de données formalisant les connaissances d'un domaine. Web Ontology Language (OWL) est le langage préconisé par le W3C pour les définir.
Bien que incomplets, hétérogènes et pouvant contenir des erreurs, ces graphes de connaissances contiennent une mine d’informations importantes qui peuvent être exploitées et analysées pour découvrir de nouvelles connaissances. Plusieurs approches existantes s'inspirent de techniques issues de différents domaines, tels que la fouille de données, le raisonnement et l’apprentissage automatique. Afin d’appréhender l’hétérogénéité des données et la complexité de certains domaines, tels que l’agronomie, l’IoT ou encore la médecine, le besoin de concevoir des approches hybrides combinant différentes techniques, se fait de plus en plus sentir.
L’objectif des journées de l’action RoD du 25 et 26 mai 2020 est de réunir les chercheurs intéressés pour échanger et discuter autour de la problématique de la découverte de connaissances combinant des techniques de fouille de données, de raisonnement et d’apprentissage automatique. Ces journées seront l'occasion de présenter des approches (mêmes préliminaires) récentes sur le sujet et d'identifier les verrous à lever.
Les sujets d'intérêt comprennent, sans s'y limiter, les thèmes suivants :
- Fouille de données graphes : règles, motifs, séquences, etc.
- Complétion de graphes de connaissances
- Raisonnement sur les graphes de connaissances
- Etudes statistiques du contenu des graphes de connaissances
- Plongements de graphes (graph embeddings)
- Modèles de provenance et processus de découverte de connaissances
- Explicabilité des méthodes de découverte de connaissances fondées sur l'apprentissage automatique
- Evaluation de la qualité des graphes de connaissances et des connaissances découvertes
- Evaluation des approches de découverte de connaissances : nouvelles mesures, benchmarks, crowdsourcing, ...
- Domaines d'application : finance, musique, tourisme, histoire, agriculture, environnement, maritime, mobilité, etc. :
- ...
Soumission
Il est demandé de soumettre le titre et un résumé présentant le contenu de la présentation orale qui pourra être faite pendant les journées. Ce résumé peut décrire de nouvelles idées qui n'ont pas encore été évaluées. Ce résumé peut également correspondre à un article déjà accepté dans une conférence internationale afin de faire bénéficier la communauté RoD de ces travaux. Le résumé devra alors contenir un lien vers l'article publié.
Le résumé devra être soumis via easychair.
Comité d'organisation
- Nathalie HERNANDEZ, IRIT, UT2J
- Marie-Laure MUGNIER, LIRMM, INS2i
- Marie-Christine ROUSSET, LIG, INS2i
- Catherine ROUSSEY, INRAE
- Fatiha SAIS, LRI, INS2I, Université Paris Saclay
Programme
A définir