Groupement d'Intérêt Scientifique PAROLOTHEQUE

Par analogie aux tumorothèques, une Parolothèque est une banque d’échantillons de parole enregistrés, obtenus à partir de bilans de trouble de la parole ou du langage ou à partir d’entretiens ou d’interviews de personnes concernées par les pathologies tumorales.

Bien que les enregistrements seront orientés par la recherche initiale (ou originelle), une automatisation de la transcription « sophistiquée » comprenant si besoin le repérage des différents locuteurs, la segmentation à partir d’une catégorisation sémantique rendra réalisable la réutilisation de la série d’interviews. Ces échantillons seront conservés dans un format numérique sur un serveur dédié au stockage d’enregistrements sonores et recensés dans une Base de données enrichies d’informations permettant leur l’archivage puis leur exploitation sur requête.

Ces données s’étendent du code de surface aux aspects contextuels voir conversationnels et peuvent faire l’objet d’une lecture psychologique voir épidémiologique ou sociologique. La Parolothèque sera ainsi alimentée par des recherches en SHS. Elle alimentera elle-même une recherche dans le domaine du traitement automatique des langues et fournira un service facilitant la recherche pour d’autres disciplines.

L’objectif principal de ce projet est d’établir un corpus de voix et de parole de patients atteints de cancer. Ce corpus pourra ensuite être analysé et étudié autant du point de vue de son contenant (parole) que de son contenu (discours). Il permettra de développer des axes de recherches variés et l’élaboration de publications scientifiques dans divers domaines (sciences humaines et sociales : SHS, épidémiologie, linguistique, informatique…).

Schéma de la gestioin des données

Schéma global parolotheque

Organismes représentés

UPS
CNRS 
INPT 
UT1   
UT2   
CHU-T    
ICR   

Contact

  • Virginie Woisard
  • Pascal Gaillard
  • Julien Pinquier
  • Jérôme Farinas