Jobs - SAMoVA

PhD positions available :

More soon…

Past PhDs (click to show)

Modélisation automatique de l’efficacité pharyngo laryngée et d’indicateurs de déglutition à partir de capteurs non invasifs
Deep learning approaches to assess head and neck cancer voice intelligibility – Comparaison des représentations internes des réseaux de neurones profonds avec des représentations subjectives sur des voix pathologiques (ESR6, funding TAPAS, start in 2018, Marie SkÅ‚odowska-Curie Actions), Eugenia Rykova.
Clinical relevance of the intelligibility measures – Etude des différentes mesures utilisées en clinique pour évaluer la parole pathologique (ESR9, funding TAPAS, start in 2018, Marie SkÅ‚odowska-Curie Actions), Timothy Pommée
Segmentation et regroupement en chanteurs. Application aux enregistrements ethnomusicologiques, Marwa Thlithi, 2016 (PDF)
Perception multimodale de l'homme pour l'Interaction Homme-Robot, Christophe Mollaret, 2015 (PDF)
Spectre de rythme et sources multiples : au coeur des contenus ethnomusicologiques et sonores, Maxime Le Coz, 2014 (PDF available at WWW)
Caractérisation et reconnaissance de sons d'eau pour le suivi des activités de la vie quotidienne, Une approche fondée sur le signal, l'acoustique et la perception, Patrice Guyot, 2014 (PDF)
Extraction multimodale de la structure narrative des épisodes de séries télévisées, Philippe Ercolessi, 2013 (PDF)
Masquage de pertes de paquets en voix sur IP. Thèse de doctorat, Institut National Polytechnique de Toulouse, Lionel Koenig, 2011 (PDF available at WWW)
Recherche du rôle des intervenants et de leurs interactions pour la structuration de documents audiovisuels, Benjamin Bigot, 2011 (PDF)
Unsupervised Video Indexing based on Audiovisual Characterization of Persons, Elie El Khoury, 2010 (PDF)
Fusion de données audio-visuelles pour l'interaction Homme-Robot, Brice Burger, 2010 (PDF)

2024 internship positions:

Past internships (click to show) :

Self- and semi-supervised adaptation of neural speaker diarization, Alexis Plaquet, 2022
Self-supervised audio representation learning, Florent Meyer, 2022
Analyse des signaux IoT (audio et accéléromètre) issus du collier Swallis Médical en vue de la modélisation de l’efficacité pharyngolaryngée, Ibrahim Abdullah, 2022
Le traitement automatique de la parole et l'IA au service du diagnostic différencié de maladies neurodégénératives, Richard Judenne, 2022
Modélisation de la prosodie pour la détection des émotions, Jérôme Susgin, 2022
Apprentissage de langues étrangères assisté par ordinateur, Mikaël Allanos, 2022
Discriminative sequence training in end-to-end automatic speech recognition, non pourvu, 2022
Apprentissage multi-tâche pour le traitement de la parole et de la langue dans le cadre de conversations spontanées multi-locuteurs, non pourvu, 2022
End-to-end speech recognition for assessing children learning to read, Louis Castres Saint Martin, 2022

Caractérisation et modélisation de voix pathologiques, Jules Tricot, 2021
Telephone speech recognition, Clément Lemeunier, 2021
Développement d'interface web pour l'annotation de type “audio captioning”, Adrian Benard, 2021
Reconnaissance d'événements sonores par apprentissage profond, Nicolas Chabriac, 2021
Spécialisations de systèmes de reconnaissance de la parole et mise en place sous forme de service web, Gildas Cherrier, stage M1 N7, 2021

Automatic speech recognition system for neurological test, Lila Gravellier, 2020 (report, slides)
Validation d’une grille d’évaluation de la constitution des cercles sociaux auprès d’une population de sujets sains adultes : Anaïs Cance, 2020
Constitution d’une base de données audio en vue de la création d’un outil automatisé d’évaluation de la parole : Anthéa Frize, 2020
État des lieux de l’évaluation orthophonique des troubles de la production de la parole chez l’adulte – Point de vue du patient : Hermine de Ferrière et Claire Roussel, 2020.
Prédiction de la difficulté de compréhension de contenu audiovisuel : approche basée sur des données textuelles faiblement annotées, Justine Revol, 2020 (report)

Mise en place d’un protocole d’évaluation pour la détection de sons environnementaux liés à la sécurité, Adrien Nigou, 2019 (slides)
Etude de l'environnement sonore : séparation parole / bruit, Marwin Jaubert, 2019 (report)
Les silences : de nouveaux indicateurs pour l’analyse des interactions ?, Selin Mechrouh, 2019 (report)
Détection de call signs et de phraséologie d’urgence dans des enregistrements de la radio du trafic aérien, Antoine Viette, 2019 (report, slides)
Analyse acoustique des signaux de déglutition, Zakaria Boubkari, 2019 (report)
Reconnaissance automatique de la parole pour le spectacle vivant : comparaison Google ASR API et système maison, Erwan Gateau-Magdeleine, 2019 (slides, results, git)
Détection acoustique de défaut de pale dans les moteurs d'avion, Félix Chavelli, 2019 (slides)
Data augmentation pour la détection d'événements sonores avec des réseaux de neurones profonds, Thomas Hustache, 2019
Réalisation d’une plateforme logicielle pour l’analyse et la mesure de la dysfluence prosodique en parole pathologique (sujet), Baptiste Moret, 2019 (report)
Détection des callsigns et de la phraséologie d'urgence dans des enregistrements audio de la fréquence radio utilisée par les contrôleurs aériens, Antoine Viette, ENAC/IRIT, 2019
Analyse de la parole et coordination des gestes pour l’apprentissage du français langue étrangère (sujet), Kellian Ballentine, 2019 (report)
Détection automatique de la thématique et adaptation des modèles de langage (sujet), Zhang Si, 2019 (report)

Construction d’un score Carcinologic Speech Severity Index (C2SI) automatique, Mathieu Balaguer-Navarro, 2018 (report in PDF)
Sound event detection in fields recording, Comparison between signal processing and deep learning approaches, Léo Cances, 2018 (Master Thesis in PDF)
Visualisation des caractéristiques de la parole dans le cadre de l’étude des interactions vocales avec un assistant virtuel, Laïta Favier, 2018 (Rapport de stage PDF)
Automatic Detection of Pronunciation Mistakes on Children Reading Aloud, Lucile Gelin, 2018 (abstract in PDF)
Comparison of methods for learning units using Dictionary Learning and Sparse Coding vs Auto-encoders, Thomas Rolland (report in PDF)

Analyse statistique de données issues du traitement de la parole pour aider au diagnostic de la maladie de Parkinson,
Recommandation musicale personnalisée à l’aide d’une expertise musicale, Nicolas Dauban, 2017 (report in PDF)
Reconnaissance de messages audio dans un environnement de cockpit d’avion,
Evaluation de l’intelligibilité d’une conversation dans un environnement de cockpit d’avion,
Extraction automatique de textes incrustés dans des vidéos à l’aide d’un OCR,
Analyse et caractérisation automatique de dialogues dans les contenus audiovisuels
Outil d'annalyse automatique de contenu audiovisuel pour l'aide à l'enseignement des langues étrangères : étude de faisabilité, Estelle Randria, 2017 (Rapport de stage PDF)

Utilisation des résultats d'un moteur de reconnaissance automatique de la parole pour orienter les réglages de prothèses auditives, Dim Sleiman, 2016 (report in PDF)
Goodness of Singing, évaluation automatique d'un apprenant chanteur, Charles Laplane, 2016 (report in PDF)
Audio Fast & Automated Tuning: Development of a smart algorithm for in call voice analysis. Abdelwahab Heba, 2016 (report in PDF)
Apprentissage de similarités « multi-niveaux » pour la suggestion de contenus musicaux, Florian Mouret, 2016 (report in PDF)
Apprentissage automatique de paramètres acoustiques pour la classification de différents niveaux de charges cognitives,
Etude automatique des pauses remplies chez les personnes agrammatiques, Victor David, 2016 (report in PDF)
Développement de mesures objectives sur l'intelligibilité de voix pathologiques, Brendan Gloinec, 2016 (report in PDF)
Synchronisation audio de flux TV sur mobile, Sébastien Ferreira (report in PDF) and Lucien Mahot (report in PDF)
Détection de Fast-ripples dans les EEGs de patients atteints d'épilepsie, Vincent Chrun, 2016 (report in PDF)

Réseaux de neurones convolutionnels pour des tâches de traitement de l'audio, Valentin Barrière, 2015 (report in PDF)
Comparaison de mesures automatiques d'intelligibilité pour des signaux de parole simulant la perception de personnes mal entendantes, Vincent Laborde, 2015 (report in PDF)
Interface pour la recherche et l'exploitation de documents audiovisuels en classe de langue étrangère, Vincent Heit, 2015 (report in PDF)
Gestion contextuelle et multimodale de l'interaction Homme-Robot, Maxime Roblin, 2015 (report in PDF)
Structuration de documents audiovisuels, Frédéric de Blanchaud, 2015 (report in PDF)
Création d'une plate-forme Web de partage et de traitement de fichiers audio, Tony Doin, 2015 (report in PDF)
Pyc2sound : Génération de son à partir d'images, Vincent Bragard, 2015 (report in PDF)

Previous Subjects