Recherches

Traitement Automatique de la Parole

La campagne ESTER à permis à l’IRIT en 2003 d’initier la réalisation d’un système automatique de la parole grand vocabulaire. Je me suis consacré à la réalisation de la modélisation acoustique et de la plateforme. Mon interêt scientifique se porte maintenant sur le traitement de la parole “atypique”. Le caractère non typique peut se retrouver lorsque la parole est altérée par des pathologies du système de production ou bien quand le contexte conversationnel est très particulier. C’est le cas pour les enregistrements de conversations entre les contrôleurs aériens et les pilotes d’avions, qui peuvent être altérées par différents bruits ambiants ou par le canal de transmission, mais également du fait d’une phraséologie bien particulière. Nous avons proposé avec Airbus une compétition en 2018 sur ce domaine afin d’évaluer les approches classiques en traitement automatique de la parole. Une collaboration avec l’ENAC a permis ensuite de mettre en place les bases d’une reconnaissance de la parole dans ce contexte. Depuis 2013, nous collaborons également avec le CHU de Toulouse et le laboratoire TONIC afin de développer une plateforme permettant d’automatiser les tests de fluente verbale, génération lexicale et de dommage d’images à destination des orthophonistes et praticiens hospitaliers. Le projet EVOLEX nous a permis de nous adapter à ces tests particuliers pour mettre en place une reconnaissance automatique de la parole efficiente.

J’ai également participé à un projet de maturation scientifique, financé par la SAT Toulouse Tech Transfert, à destination de la société Authôt, pour leur proposer un système de ponctuation automatique, basé sur des modélisations lexicales et prosodiques. Nous avons ensuite développé une collaboration avec Authôt visant à estimer, a priori, le taux d’erreur mots de systèmes de reconnaissance automatique de la parole. Je participe à l’encadrement de Sébastien Ferreira, qui effectue un doctorat en CIFRE sur ce sujet.

Modélisation de l’intelligibilité de la parole

A travers le projet régional ARCHEAN, nous avons mis en place une méthodologie visant à évaluer de manière objective l’intelligibilité de la parole, altérée par des simulations de la presbyacousie chez les humains. Nous avons mis en place une mesure de l’intelligibilité, basée sur des systèmes de reconnaissance de la parole, permettant de simuler le comportement des humains atteints de presbyacousie.

A travers le projet C2SI, j’ai pu contribuer à créer un corpus de parole de personnes atteintes de cancers affectant la sphère ORL, dans un but de mesurer l’intelligibilité. Cette collaboration avec le CHU de Toulouse et les laboratoire LPL, LIA et Octogone-Lordat a ensuite débouché sur le projet ANR RUGBI. Il s’agit de rechercher et de modéliser les éléments porteur de l’intelligibilité dans la parole pathologique (patients atteints de cancer ORL ou maladie de Parkinson). Je participe à l’encadrement de Mathieu Balaguer avec Julien Pinquier et Virginie Woisard. Il étudie l’Impact fonctionnel des troubles de la parole mesurés automatiquement après traitement d’un cancer oral ou oropharyngé. Je co-encadre également, avec Corinne Astésano et Virgine Woisard, le doctorat de Robin Vaysse sur une modélisation du rythme pour mesurer l’intelligibilité sur des voix pathologiques. Et enfin, avec Julien Pinquier et Virginie Woisard, je participe à  l’encadrement de Vincent Roger, qui cherche à modéliser l’intelligibilité de la parole en utilisant des méthodes d’apprentissage profond en utilisant des méthodes parcimonieuses (“one shot” ou “few shots”).

Analyse et modélisation de la déglutition

Depuis 2018, je m’intéresse à l’analyse et à la modélisation de signaux issus d’enregistrements audio et de capteurs de mouvements positionnés sur un collier développé apr la société Swallis Medical. Il s’agit d’analyser, de segmenter et d”identifier les événements de type respiration, déglutition ou toux. 

Thème : Overlay par Kaira. Texte supplémentaire
Le Cap, Afrique du sud