Responsable : Julien PINQUIER
Les travaux de l’équipe SAMoVA se placent dans le contexte de l’indexation et de la recherche de documents audio et vidéo. Notre recherche s’appuie sur le traitement du signal, la modélisation, ainsi que sur la structuration du contenu audiovisuel.
Compétences
personnel de l’équipe
publications de l’équipe
Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier
Automatic modelling of perceptual judges in the context of head and neck cancer speech intelligibility
International Journal of Language and Communication Disorders, 2024, pp.1–14. ⟨10.1111/1460-6984.13004⟩
Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard
Development of a holistic communication score (HoCoS) in patients treated for oral or oropharyngeal cancer: Preliminary validation
International Journal of Language and Communication Disorders, 2023, 58 (1), pp.39-51. ⟨10.1111/1460-6984.12766⟩
Lionel Pibre, Jorge Francisco Madrigal Diaz, Cyrille Equoy, Frédéric Lerasle, Thomas Pellegrini, Julien Pinquier, Isabelle Ferrané
Audio-video fusion strategies for active speaker detection in meetings
Multimedia Tools and Applications, 2022, 2022, pp.1-26. ⟨10.1007/s11042-022-13746-7⟩
Léo Cances, Etienne Labbé, Thomas Pellegrini
Comparison of Semi-supervised Deep Learning Algorithms for Audio Classification
EURASIP Journal on Audio, Speech, and Music Processing, 2022, 2022 (1, article 23), pp.1-14. ⟨10.1186/s13636-022-00255-6⟩
Vincent Roger, Jérôme Farinas, Julien Pinquier
Deep neural networks for automatic speech processing: a survey from large corpora to limited data
EURASIP Journal on Audio, Speech, and Music Processing, 2022, article 19, pp.1-15. ⟨10.1186/s13636-022-00251-w⟩
Mathieu Balaguer, Timothy Pommée, Julien Pinquier, Jérôme Farinas, Virginie Woisard, Florence Sordes
Development and preliminary validation of the questionnaire ‘Evaluation of the constitution of social circles (ECSC)’ in patients treated for cancer of the upper aerodigestive tract
Folia Phoniatrica et Logopaedica, 2022, 75 (1), pp.52-66. ⟨10.1159/000525352⟩
Lionel Fontan, Libio Gonçalves Braz, Julien Pinquier, Michael Stone, Christian Füllgrabe
Using Automatic Speech Recognition to Optimize Hearing-Aid Time Constants
Frontiers in Neuroscience, 2022, 16 (779062), ⟨10.3389/fnins.2022.779062⟩
Libio Gonçalves Braz, Lionel Fontan, Julien Pinquier, Michael A Stone, Christian Füllgrabe
OPRA-RS: A Hearing-Aid Fitting Method Based on Automatic Speech Recognition and Random Search
Frontiers in Neuroscience, 2022, 16, pp.779048. ⟨10.3389/fnins.2022.779048⟩
Renée Speyer, Anna-Liisa Sutt, Liza Bergström, Shaheen Hamdy, Timothy Pommée, Mathieu Balaguer, Anett Kaale, Reinie Cordier
Neurostimulation in People with Oropharyngeal Dysphagia
Journal of Clinical Medicine, 2022, Special issue : Advances in Management of Voice and Swallowing Disorders, 11 (4), pp.993. ⟨10.3390/jcm11040993⟩
Chems-Eddine Himeur, Thibault Lejemble, Thomas Pellegrini, Mathias Paulin, Loic Barthe, Nicolas Mellado
PCEDNet : A Lightweight Neural Network for Fast and Interactive Edge Detection in 3D Point Clouds
ACM Transactions on Graphics, 2022, 41 (1), pp.1-21. ⟨10.1145/3481804⟩
Mathieu Balaguer, Timothy Pommée, Jérôme Farinas, Julien Pinquier, Virginie Woisard
Paramètres perceptifs expliquant la sévérité du trouble de parole mesurée automatiquement en cancérologie ORL
Rééducation orthophonique, 2021, Chapitre : “De l’exploration à la prise en soins de la voix chez l’adulte : données actuelles.. sur la voie des voix”, 286, pp.1-13
Mathieu Balaguer, Josiane Percodani, Virginie Woisard
Le Carcinologic Handicap Index (CHI) : questionnaire d’autoévaluation du handicap à destination des patients traités pour cancer des VADS
Annales françaises d’Oto-rhino-laryngologie et de Pathologie Cervico-faciale, 2017, 134 (6), pp.382-387. ⟨10.1016/j.aforl.2016.07.021⟩
Service Temporarily Unavailable
The server is currently unable to handle the request due to a temporary overloading or maintenance of the server.
Service Temporarily Unavailable
The server is currently unable to handle the request due to a temporary overloading or maintenance of the server.
Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier
Can we use speaker embeddings on spontaneous speech obtained from medical conversations to predict intelligibility?
IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2023), IEEE, Dec 2023, Taipei, Taiwan. à paraître
Marvin Lavechin, Marianne Métais, Hadrien Titeux, Alodie Boissonnet, Jade Copet, Morgane Rivière, Elika Bergelson, Alejandrina Cristia, Emmanuel Dupoux, Hervé Bredin
Brouhaha: multi-task training for voice activity detection, speech-to-noise ratio, and C50 room acoustics estimation
IEEE Automatic Speech Recognition and Understanding (ASRU 2023 ), IEEE, Dec 2023, Taipei, Taiwan. pp.1–7
Ismail Khalfaoui-Hassani, Timothée Masquelier, Thomas Pellegrini
Audio classification with Dilated Convolution with Learnable Spacings
NeurIPS 2023 – Workshop on Machine Learning for Audio, Dec 2023, New Orleans, United States
Automatic assessment of L2 speech from proficiency to comprehensibility: illustration among Japanese learners of French
Speech assessment and native and non-native linguistic variation (2023), Oct 2023, Tokyo (JP), Japan
Etienne Labbé, Thomas Pellegrini, Julien Pinquier
Killing two birds with one stone: can an audio captioning system also be used for audio-test retrieval?
8th workshop on Detection and Classification of Acoustic Scenes and Events (DCASE2023), Sep 2023, Tampere, Finland
Etienne Labbé, Julien Pinquier, Thomas Pellegrini
Multitask learning in Audio Captioning: a sentence embedding regression loss acts as a regularizer
31st European Signal Processing Conference (EUSIPCO 2023), Sep 2023, Helsinki, Finland. ⟨10.48550/arXiv.2305.01482⟩
Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard
Measurement of communication impairment after treatment for oral and oropharyngeal cancer by automatic analyses of spontaneous speech associated with biopsychosocial factors
32nd World Congress of the IALP (2023), IALP: International Association of Communication Sciences and Disorders, Aug 2023, Auckland, New Zealand
Powerset multi-class cross entropy loss for neural speaker diarization
24th INTERSPEECH Conference (INTERSPEECH 2023), Aug 2023, Dublin, Ireland. pp.3222-3226, ⟨10.21437/Interspeech.2023-205⟩
Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard
Development of a holistic communication score (HoCoS) in patients treated for oral or oropharyngeal cancer: preliminary validation
32nd World Congress of the IALP (2023), IALP: International Association of Communication Sciences and Disorders, Aug 2023, Auckland, New Zealand
pyannote.audio 2.1 speaker diarization pipeline: principle, benchmark, and recipe
24th INTERSPEECH Conference (INTERSPEECH 2023), Aug 2023, Dublin, Ireland. pp.1983-1987, ⟨10.21437/Interspeech.2023-105⟩
Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané
Détection et classification automatiques d’erreurs de prononciation en L2 : approche basée sur les connaissances didactiques
Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France
Verdiana De Fino, Isabelle Ferrané, Lionel Fontan, Julien Pinquier
Prédiction de la compréhensibilité de la parole d’apprenants de français
Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France
Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard
Mesure du trouble de parole dans le suivi cancérologique grâce à la reconnaissance automatique de la parole
55e Congrès de la Société Française de Chirurgie Cervico-Faciale (SFCCF 2023), Université de Nantes; Société Française de Chirurgie Cervico-Faciale, Nov 2023, Nantes, France
Parole et communication après cancer oral ou oropharyngé : l’évaluation clinique au cours du suivi du patient
58e Congrès Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale (2023), Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale, Oct 2023, Toulouse, France
Jérôme Farinas, Corine Astesano, Robin Vaysse
Caractérisation automatique du rythme de la parole
Journée scientifique de Toulouse Mind and Brain Institute (TMBI 2023), Toulouse Mind and Brain Institute, May 2023, Toulouse, France
Vincent Roger, Jérôme Farinas, Virginie Woisard, Julien Pinquier
Création d’une mesure entropique de la parole pour évaluer l’intelligibilité de patients atteints de cancers des voies aérodigestives supérieures
34èmes Journées d’Études sur la Parole (JEP 2022), Association Française de la Communication Parlée, Jun 2022, Ile de Noirmoutier, France. pp.117-125, ⟨10.21437/JEP.2022-13⟩
Robin Vaysse, Alain Ghio, Corine Astésano, Jérôme Farinas, François Viallet
Analyse macroscopique des variations et modulations de F0 en lecture dans la maladie de Parkinson : données sur 320 locuteurs
34èmes Journées d’Études sur la Parole (JEP 2022), Association Française de la Communication Parlée, Jun 2022, Noirmoutier, France. pp.307–315, ⟨10.21437/JEP.2022-33⟩
Evaluation automatique de l’intelligibilité pour des patients présentant une atteinte de la voix
Premier webinaire de Start in Lab Santé 2021, Digital 113, Nov 2021, Toulouse, France
Mathieu Balaguer, Lucile Gelin, Virginie Woisard, Jérôme Farinas, Julien Pinquier
Mesure de l’intelligibilité après cancer oral ou oropharyngé par un système de reconnaissance automatique de la parole
1ère Journée Scientifique d’Orthophonie, SURO Société Universitaire de Recherche en Orthophonie, Oct 2021, Congrès en ligne, France
La laryngophoniatrie du futur
Congrès National de la Société Française d’ORL, 2021, Paris, France
Etienne Sicard, Anne Menin-Sicard, Marie Daumet, Stéphanie Perriere, Océane Barbera
Evaluation de la voix avant/après suivi orthophonique -à propos de la méthodologie d’évaluation et de la fiabilité des mesures chiffrées
Ortho Editions. Efficacité des thérapies, Ortho Editions, pp.233-264, 2017, 978-2-36235-100-6
Alexandre Boyer, Etienne Sicard
Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC
Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1
Service Temporarily Unavailable
The server is currently unable to handle the request due to a temporary overloading or maintenance of the server.
La parole : du traitement automatique à la mesure de l’intelligibilité
Intelligence artificielle [cs.AI]. Université Paul Sabatier (Toulouse 3), 2023
Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30104⟩
Caractérisation automatique du rythme de la parole : application aux cancers des voies aéro-digestives supérieures et à la maladie de Parkinson
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30062⟩
Deep learning approaches to assess speech intelligibility of head and neck cancer
Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30272⟩
Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?
Informatique [cs]. Université Paul Sabatier (Toulouse 3), 2022. Français. ⟨NNT : 2022TOU30258⟩
Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond : d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique
Apprentissage [cs.LG]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30180⟩
Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes
Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30031⟩
Apprentissage profond faiblement supervisé et semi-supervisé pour la détection d’évènements sonores
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30262⟩
Les mesures d’intelligibilité : état de l’art, considérations pratiques pour l’applicabilité clinique et explorations acoustiques
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30141⟩
Mesure de l’altération de la communication par analyses automatiques de la parole spontanée après traitement d’un cancer oral ou oropharyngé
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30109⟩
Etienne Sicard, Anne Menin-Sicard
La diadococinésie et son application en orthophonique clinique
[Rapport de recherche] INSA 2020, INSA : Institut National des Sciences Appliquées de Toulouse. 2020
Etienne Sicard, Anne Menin-Sicard
Analyse de la qualité des phrases pour un bilan objectif de la parole
[Rapport de recherche] INSA Toulouse. 2019
Thomas Pellegrini, Céline Manenti, Julien Pinquier
The IRIT-UPS system @ ZeroSpeech 2017
[Research Report] IRIT. 2017
Maëlys Salingre, Jérôme Farinas, Stéphane Rabant
Automatic identification of French regional accent
[Rapport de recherche] IRIT. 2017
Service Temporarily Unavailable
The server is currently unable to handle the request due to a temporary overloading or maintenance of the server.
contrats de l’équipe
Acronyme | Titre | Resp. sc | Début – fin |
---|
Acronyme | Titre | Resp. sc | Début – fin |
---|
Acronyme | Titre | Resp. sc | Début – fin |
---|