You want to join the team? Look at our offers in the different categories and send an email to the persons mentioned.
PhD positions available :
- More soon…
Past PhDs (click to show)
- Modélisation automatique de l’efficacité pharyngo laryngée et d’indicateurs de déglutition à partir de capteurs non invasifs
- Deep learning approaches to assess head and neck cancer voice intelligibility – Comparaison des représentations internes des réseaux de neurones profonds avec des représentations subjectives sur des voix pathologiques (ESR6, funding TAPAS, start in 2018, Marie SkÅ‚odowska-Curie Actions), Eugenia Rykova.
- Clinical relevance of the intelligibility measures – Etude des différentes mesures utilisées en clinique pour évaluer la parole pathologique (ESR9, funding TAPAS, start in 2018, Marie SkÅ‚odowska-Curie Actions), Timothy Pommée
- Segmentation et regroupement en chanteurs. Application aux enregistrements ethnomusicologiques, Marwa Thlithi, 2016 (PDF)
- Perception multimodale de l'homme pour l'Interaction Homme-Robot, Christophe Mollaret, 2015 (PDF)
- Spectre de rythme et sources multiples : au coeur des contenus ethnomusicologiques et sonores, Maxime Le Coz, 2014 (PDF available at WWW)
- Caractérisation et reconnaissance de sons d'eau pour le suivi des activités de la vie quotidienne, Une approche fondée sur le signal, l'acoustique et la perception, Patrice Guyot, 2014 (PDF)
- Extraction multimodale de la structure narrative des épisodes de séries télévisées, Philippe Ercolessi, 2013 (PDF)
- Masquage de pertes de paquets en voix sur IP. Thèse de doctorat, Institut National Polytechnique de Toulouse, Lionel Koenig, 2011 (PDF available at WWW)
- Recherche du rôle des intervenants et de leurs interactions pour la structuration de documents audiovisuels, Benjamin Bigot, 2011 (PDF)
- Unsupervised Video Indexing based on Audiovisual Characterization of Persons, Elie El Khoury, 2010 (PDF)
- Fusion de données audio-visuelles pour l'interaction Homme-Robot, Brice Burger, 2010 (PDF)
2025 internship positions:
- Apprentissage des langues en living lab : mesures de compréhensibilité de la parole en contexte collaboratif et comodal
- Optimisation de la reconnaissance automatique de la parole pathologique
- Étude du signal de parole après cancer et liens avec les déficits moteurs en jeu dans la production de parole
- Validation clinique des modules “État cognitif” et “Fatigue” du CHI (Carcinologic Handicap Index)
- Compréhension de la parole et IA au service de l’analyse sensorielle
- …
Past internships (click to show) :
- Compréhension De La Parole Et IA Au Service De L'Analyse Sensorielle
- Adaptations De Systèmes De Reconnaissance Automatique De Parole En Contexte Pathologique
- Traitement de la parole et IA : Pour révéler des troubles articulatoires en production de parole atypique
- Modélisation Automatique Du Rythme De La Parole
- Transcription de Verbalisations pour l'Analyse du Discours lors de Scénarios en Réalité Virtuelle
- 3 research and 3 engineering internships around neural speaker diarization
- Traitement automatique de la parole au service de l’analyse sensorielle
- Traitement de signal et IA
pour révéler des troubles articulatoires en production de parole atypique, Lamia Belkadi (report) - Modélisation automatique de l’efficacité pharyngo laryngée et d’indicateurs de déglutition à partir de capteurs non invasifs
- Description textuelle automatique de l’audio pour le français
- Représentations neuronales auto-supervisées de parole pour reconnaître “qui parle quand ?” (speaker diarization)
- Implémentation d’une mesure de richesse du discours
- IA et Apprentissage des langues : détection et classification des erreurs de prononciation
- Self- and semi-supervised adaptation of neural speaker diarization, Alexis Plaquet, 2022
- Self-supervised audio representation learning, Florent Meyer, 2022
- Analyse des signaux IoT (audio et accéléromètre) issus du collier Swallis Médical en vue de la modélisation de l’efficacité pharyngolaryngée, Ibrahim Abdullah, 2022
- Le traitement automatique de la parole et l'IA au service du diagnostic différencié de maladies neurodégénératives, Richard Judenne, 2023 (report)
- Modélisation de la prosodie pour la détection des émotions, Jérôme Susgin, 2022
- Apprentissage de langues étrangères assisté par ordinateur, Mikaël Allanos, 2022
- Discriminative sequence training in end-to-end automatic speech recognition, non pourvu, 2022
- Apprentissage multi-tâche pour le traitement de la parole et de la langue dans le cadre de conversations spontanées multi-locuteurs, non pourvu, 2022
- End-to-end speech recognition for assessing children learning to read, Louis Castres Saint Martin, 2022
- Caractérisation et modélisation de voix pathologiques, Jules Tricot, 2021 (report)
- Telephone speech recognition, Clément Lemeunier, 2021
- Développement d'interface web pour l'annotation de type “audio captioning”, Adrian Benard, 2021
- Reconnaissance d'événements sonores par apprentissage profond, Nicolas Chabriac, 2021
- Spécialisations de systèmes de reconnaissance de la parole et mise en place sous forme de service web, Gildas Cherrier, stage M1 N7, 2021
- Automatic speech recognition system for neurological test, Lila Gravellier, 2020 (report, slides)
- Validation d’une grille d’évaluation de la constitution des cercles sociaux auprès d’une population de sujets sains adultes : Anaïs Cance, 2020
- Constitution d’une base de données audio en vue de la création d’un outil automatisé d’évaluation de la parole : Anthéa Frize, 2020
- État des lieux de l’évaluation orthophonique des troubles de la production de la parole chez l’adulte – Point de vue du patient : Hermine de Ferrière et Claire Roussel, 2020.
- Prédiction de la difficulté de compréhension de contenu audiovisuel : approche basée sur des données textuelles faiblement annotées, Justine Revol, 2020 (report)
- Mise en place d’un protocole d’évaluation pour la détection de sons environnementaux liés à la sécurité, Adrien Nigou, 2019 (slides)
- Etude de l'environnement sonore : séparation parole / bruit, Marwin Jaubert, 2019 (report)
- Les silences : de nouveaux indicateurs pour l’analyse des interactions ?, Selin Mechrouh, 2019 (report)
- Détection de call signs et de phraséologie d’urgence dans des enregistrements de la radio du trafic aérien, Antoine Viette, 2019 (report, slides)
- Analyse acoustique des signaux de déglutition, Zakaria Boubkari, 2019 (report)
- Reconnaissance automatique de la parole pour le spectacle vivant : comparaison Google ASR API et système maison, Erwan Gateau-Magdeleine, 2019 (slides, results, git)
- Détection acoustique de défaut de pale dans les moteurs d'avion, Félix Chavelli, 2019 (slides)
- Data augmentation pour la détection d'événements sonores avec des réseaux de neurones profonds, Thomas Hustache, 2019
- Réalisation d’une plateforme logicielle pour l’analyse et la mesure de la dysfluence prosodique en parole pathologique (sujet), Baptiste Moret, 2019 (report)
- Détection des callsigns et de la phraséologie d'urgence dans des enregistrements audio de la fréquence radio utilisée par les contrôleurs aériens, Antoine Viette, ENAC/IRIT, 2019
- Analyse de la parole et coordination des gestes pour l’apprentissage du français langue étrangère (sujet), Kellian Ballentine, 2019 (report)
- Détection automatique de la thématique et adaptation des modèles de langage (sujet), Zhang Si, 2019 (report)
- Construction d’un score Carcinologic Speech Severity Index (C2SI) automatique, Mathieu Balaguer-Navarro, 2018 (report in PDF)
- Sound event detection in fields recording, Comparison between signal processing and deep learning approaches, Léo Cances, 2018 (Master Thesis in PDF)
- Visualisation des caractéristiques de la parole dans le cadre de l’étude des interactions vocales avec un assistant virtuel, Laïta Favier, 2018 (Rapport de stage PDF)
- Automatic Detection of Pronunciation Mistakes on Children Reading Aloud, Lucile Gelin, 2018 (abstract in PDF)
- Comparison of methods for learning units using Dictionary Learning and Sparse Coding vs Auto-encoders, Thomas Rolland (report in PDF)
- Analyse statistique de données issues du traitement de la parole pour aider au diagnostic de la maladie de Parkinson, Robin Vaysse, 2028 (report in PDF)
- Recommandation musicale personnalisée à l’aide d’une expertise musicale, Nicolas Dauban, 2017 (report in PDF)
- Reconnaissance de messages audio dans un environnement de cockpit d’avion,
- Evaluation de l’intelligibilité d’une conversation dans un environnement de cockpit d’avion,
- Extraction automatique de textes incrustés dans des vidéos à l’aide d’un OCR,
- Analyse et caractérisation automatique de dialogues dans les contenus audiovisuels
- Outil d'annalyse automatique de contenu audiovisuel pour l'aide à l'enseignement des langues étrangères : étude de faisabilité, Estelle Randria, 2017 (Rapport de stage PDF)
- Utilisation des résultats d'un moteur de reconnaissance automatique de la parole pour orienter les réglages de prothèses auditives, Dim Sleiman, 2016 (report in PDF)
- Goodness of Singing, évaluation automatique d'un apprenant chanteur, Charles Laplane, 2016 (report in PDF)
- Audio Fast & Automated Tuning: Development of a smart algorithm for in call voice analysis. Abdelwahab Heba, 2016 (report in PDF)
- Apprentissage de similarités « multi-niveaux » pour la suggestion de contenus musicaux, Florian Mouret, 2016 (report in PDF)
- Apprentissage automatique de paramètres acoustiques pour la classification de différents niveaux de charges cognitives,
- Etude automatique des pauses remplies chez les personnes agrammatiques, Victor David, 2016 (report in PDF)
- Développement de mesures objectives sur l'intelligibilité de voix pathologiques, Brendan Gloinec, 2016 (report in PDF)
- Synchronisation audio de flux TV sur mobile, Sébastien Ferreira (report in PDF) and Lucien Mahot (report in PDF)
- Détection de Fast-ripples dans les EEGs de patients atteints d'épilepsie, Vincent Chrun, 2016 (report in PDF)
- Réseaux de neurones convolutionnels pour des tâches de traitement de l'audio, Valentin Barrière, 2015 (report in PDF)
- Comparaison de mesures automatiques d'intelligibilité pour des signaux de parole simulant la perception de personnes mal entendantes, Vincent Laborde, 2015 (report in PDF)
- Interface pour la recherche et l'exploitation de documents audiovisuels en classe de langue étrangère, Vincent Heit, 2015 (report in PDF)
- Gestion contextuelle et multimodale de l'interaction Homme-Robot, Maxime Roblin, 2015 (report in PDF)
- Structuration de documents audiovisuels, Frédéric de Blanchaud, 2015 (report in PDF)
- Création d'une plate-forme Web de partage et de traitement de fichiers audio, Tony Doin, 2015 (report in PDF)
- Pyc2sound : Génération de son à partir d'images, Vincent Bragard, 2015 (report in PDF)
Previous Subjects
- Mesure objective de la qualité audio et évaluation de l’intelligibilité de la parole dans des enregistrements de boîtes noires,
- Techniques de visualisation pour les réseaux de neurones convolutifs appliquées à la phonétique acoustique pour la comparaison de voix,
- Modélisation de voix Parkinson et MSA en utilisant des i-vecteurs,
- Étude d’une tâche de répétition de syllabe pour la caractérisation de voix pathologiques,
- Research on alternative representations for automatic speech recognition on reading learning child’s speech,
- Réseaux de neurones profonds en auto-apprentissage pour la détection d'événements sonores dans un contexte semi-supervisé,
- Évaluation de l’impact du réglage des prothèses auditives sur l’écoute de la musique,
- Conception et développement pour l’animation 3D d’un avatar dans un contexte d'e-learning et apprentissage des langues,
Post-doc positions available:
Research Engineer positions available:
- Research Engineer Position in Automatic Speech Recognition for Computer-Assisted Language Learning (CALL) applications (EN, FR)
Research Engineer positions on going:
-
- Développement d’une application de mesure d’intelligibilité pour la parole pathologique, Gautier Arcin, 2021
- Intégration et animation d’un avatar dans une plateforme d’apprentissage des langues, Amélie Le Chevanton, 2021