SAMOVA Team

Permanent members

Régine ANDRÉ-OBRECHTProfessor Emérite (HDR) – UT3
Mathieu BALAGUERAssociate Professor – UT3
Hervé BREDINResearch Scientist – CNRS
Jérôme FARINASAssociate Professor (HDR) – UT3
Isabelle FERRANÉAssociate Professor – UT3
Philippe JOLYProfessor – UT3
Julie MAUCLAIRAssociate Professor – UT3
Thomas PELLEGRINIAssociate Professor – UT3
Julien PINQUIERAssociate Professor (HDR) – UT3
Christine SENACAssociate Professor – UT3

Non-permanent members

Philippe ALLETPhD Student – UT3 (joint direction APO)
Elie BANIDEIntern niveau M2 – Université Paris Est Créteil
Lamia BELKADIIntern niveau M2 – UT3
Anaïs BOULZEIntern niveau M1 – UT3
Satya CAPBLANCQIntern –
Néo DE SA MOREIRAIntern niveau M1 – UT3
Gabriel FARAUTIntern – UT3
Lila GRAVELLIERPhD Student – UT3
Etienne LABBÉContractual Researcher – UT3
Adrien LAFOREPhD Student – UT3 (joint direction MELODI)
Martin LEBOURDAISContractual Researcher – CNRS
Maelys LEIÇARRAGUEIntern niveau licence – UT3
Clément PAGESDevelopment Engineer – CNRS
Jim PETIOTDevelopment Engineer – UT3
Alexis PLAQUETPhD Student – UT3
Sebastiao QUINTASContractual Researcher – ANITI
Ludovic TUNCAYPhD Student – UT3

External members

Lucile GELINGuest Researcher – Lalilo

International journals articles

Sebastião Quintas, Robin Vaysse, Mathieu Balaguer, Vincent Roger, Julie Mauclair, Jérôme Farinas, Virginie Woisard, Julien Pinquier, Julien Pinquier

SAMI: an M-Health application to telemonitor intelligibility and speech disorder severity in head and neck cancers

Frontiers in Artificial Intelligence, 2024, 7, ⟨10.3389/frai.2024.1359094⟩

Accès: https://hal.science/hal-04595273

Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

Automatic modelling of perceptual judges in the context of head and neck cancer speech intelligibility

International Journal of Language and Communication Disorders, 2024, pp.1–14. ⟨10.1111/1460-6984.13004⟩

Accès: https://hal.science/hal-04405083

Renée Speyer, Mathieu Balaguer, Emmanuelle Cugy, Clémence Devoucoux, Sylvain Morinière, Gaëlle Soriano, Eric Vérin, Virginie Woisard

Expert Consensus on Clinical Decision Making in the Disease Trajectory of Oropharyngeal Dysphagia in Adults: An International Delphi Study

Journal of Clinical Medicine, 2023, 12 (20), pp.6572. ⟨10.3390/jcm12206572⟩

Accès: https://hal.science/hal-04595268

Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

Development of a holistic communication score (HoCoS) in patients treated for oral or oropharyngeal cancer: Preliminary validation

International Journal of Language and Communication Disorders, 2023, 58 (1), pp.39-51. ⟨10.1111/1460-6984.12766⟩

Accès: https://hal.science/hal-03765649v2

Lionel Pibre, Jorge Francisco Madrigal Diaz, Cyrille Equoy, Frédéric Lerasle, Thomas Pellegrini, Julien Pinquier, Isabelle Ferrané

Audio-video fusion strategies for active speaker detection in meetings

Multimedia Tools and Applications, 2022, 2022, pp.1-26. ⟨10.1007/s11042-022-13746-7⟩

Accès: https://hal.science/hal-03792965

Léo Cances, Etienne Labbé, Thomas Pellegrini

Comparison of Semi-supervised Deep Learning Algorithms for Audio Classification

EURASIP Journal on Audio, Speech, and Music Processing, 2022, 2022 (1, article 23), pp.1-14. ⟨10.1186/s13636-022-00255-6⟩

Accès: https://hal.science/hal-03855042

Vincent Roger, Jérôme Farinas, Julien Pinquier

Deep neural networks for automatic speech processing: a survey from large corpora to limited data

EURASIP Journal on Audio, Speech, and Music Processing, 2022, article 19, pp.1-15. ⟨10.1186/s13636-022-00251-w⟩

Accès: https://hal.science/hal-03755976

Timothy Pommée, Mathieu Balaguer, Julie Mauclair, Julien Pinquier, Virginie Woisard

Criteria for creating new standard reading passages for the assessment of speech and voice: A Delphi consensus study

Clinical Linguistics & Phonetics, 2022, 37 (8), pp.722-741. ⟨10.1080/02699206.2022.2080589⟩

Accès: https://hal.science/hal-04595275

Mathieu Balaguer, Timothy Pommée, Julien Pinquier, Jérôme Farinas, Virginie Woisard, Florence Sordes

Development and preliminary validation of the questionnaire ‘Evaluation of the constitution of social circles (ECSC)’ in patients treated for cancer of the upper aerodigestive tract

Folia Phoniatrica et Logopaedica, 2022, 75 (1), pp.52-66. ⟨10.1159/000525352⟩

Accès: https://hal.science/hal-03716864

Libio Gonçalves Braz, Lionel Fontan, Julien Pinquier, Michael A Stone, Christian Füllgrabe

OPRA-RS: A Hearing-Aid Fitting Method Based on Automatic Speech Recognition and Random Search

Frontiers in Neuroscience, 2022, 16, pp.779048. ⟨10.3389/fnins.2022.779048⟩

Accès: https://ut3-toulouseinp.hal.science/hal-03582025

National journals articles

Jérôme Farinas

La modélisation automatique de l’intelligibilité pour améliorer la qualité de vie des patients atteints de troubles de la parole : un exemple d’IA dans le domaine médical

A.N.A.E. Approche neuropsychologique des apprentissages chez l’enfant, 2024, 36 (189), pp.137-141

Accès: https://hal.science/hal-04602548v2

Mathieu Balaguer, Timothy Pommée, Jérôme Farinas, Julien Pinquier, Virginie Woisard

Paramètres perceptifs expliquant la sévérité du trouble de parole mesurée automatiquement en cancérologie ORL

Rééducation orthophonique, 2021, Chapitre : “De l’exploration à la prise en soins de la voix chez l’adulte : données actuelles.. sur la voie des voix”, 286, pp.1-13

Accès: https://ut3-toulouseinp.hal.science/hal-03277422

Mathieu Balaguer, Josiane Percodani, Virginie Woisard

Le Carcinologic Handicap Index (CHI) : questionnaire d’autoévaluation du handicap à destination des patients traités pour cancer des VADS

Annales françaises d’Oto-rhino-laryngologie et de Pathologie Cervico-faciale, 2017, 134 (6), pp.382-387. ⟨10.1016/j.aforl.2016.07.021⟩

Accès: https://hal.science/hal-02553232

National journals articles

Sylvain Detey, Lionel Fontan, Thomas Pellegrini
Traitement de la prononciation en langue étrangère : approches didactiques, méthodes automatiques et enjeux pour l’apprentissage
In : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 57, N. 3, (on line), 2016.
URL : https://www.atala.org/Traitement-de-la-prononciation-en – https://oatao.univ-toulouse.fr/19173/
BibTeX
Lionel Fontan, Cynthia Magnen, Julien Tardieu, Isabelle Ferrané, Julien Pinquier, Jérôme Farinas, Pascal Gaillard, Xavier Aumont
Comparaison de mesures perceptives et automatiques de l’intelligibilité : application à de la parole simulant la presbyacousie
In : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 55, N. 2, pp. 151-174, March 2015.
Abstract URL : http://www.atala.org/Comparaison-de-mesures-perceptives – https://oatao.univ-toulouse.fr/15274/
BibTeX
Blandine Boudet, Thérèse Giacobini, Isabelle Ferrané, Carine Fortin, Christophe Mollaret, Frédéric Lerasle, Pierre Rumeau
Quels sont les objets égarés à domicile par les personnes âgées fragiles ? Une étude pilote sur 60 personnes.
In : Neurologie – Psychiatrie – Gériatrie (NPG), Elsevier, Vol. Vol. 14/79, pp. 38-42, 2014.
URL : https://oatao.univ-toulouse.fr/13000/
BibTeX
David Janiszek, Damien Pellier, Julie Mauclair, Laetitia Boulc’H, Jean-Louis Baron, Yannick Parchemal
Utilisation de la robotique pédagogique pour enseigner l’intelligence artificielle : une expérience d’approche par projet auprès d’étudiants en informatique.
In : Sciences et Technologies de l’Information et de la Communication pour l’Éducation et la Formation (STICEF), Association des Technologies de l’Information pour l’Education et la Formation, Paris, Vol. 18, (on line), 2011.
URL : http://sticef.univ-lemans.fr/num/vol2011/07r-janiszek/sticef_2011_janiszek_07rp.html
BibTeX
Jérôme Farinas, Jean-Luc Rouas, François Pellegrino, Régine André-Obrecht
Extraction automatique de paramètres prosodiques pour l’identification automatique des langues
In : Traitement du Signal, GRETSI : Groupement de Recherche en Traitement du Signal et des Images, Vol. 22, N. 2, pp. 81-97, 2005.
URL : http://documents.irevues.inist.fr/bitstream/handle/2042/2443/02%22Andr%E9-Obrecht+couleur.pdf?sequence=1
BibTeX
Julien Pinquier, Jean-Luc Rouas, Régine André-Obrecht
Fusion de paramètres pour une classification automatique parole/musique robuste
In : Technique et science informatiques (TSI) : Fusion numérique/symbolique, Hermès, 8, quai du marche neuf, F-75004 Paris, Vol. 22, pp. 831-852, 2003.
BibTeX
Régine André-Obrecht, Abdelouafi Meziane, Bruno Jacob
Modélisation de la durée des sons dans un système de reconnaissance automatique de la parole
In : Comptes Rendus de l’Académie des Sciences, Académie des Sciences, Elsevier, Paris, Vol. t327 série IIb, pp. 379-382, 1999.
BibTeX

Special issues of journal

Philippe Ercolessi, Christine Senac, Hervé Bredin, Sandrine Mouysset
Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d’histoires
Dans : Revue des Sciences et Technologies de l’Information, Hermès Science, Vol. 15 N. 2, pp. 41-66, 2012.
URL : http://www.irit.fr/publis/SAMOVA/
BibTeX
Ebroul Iquierdo, Jenny Bennois-Pineau, Régine André-Obrecht
Special Issue on Content Based Multimedia Indexing and Retrieval
Dans : Signal Processing: Image Communication, Elsevier, Vol. 22, Issues 7-8, 2007.
BibTeX
Régine André-Obrecht
Special Issue on Speaker Recognition and its Commercial and Forensic Applications
Dans : International Journal Speech Communication, N.H Elsevier ISSN 0167-6393, North Holland, Vol. 31, Nos 2-3, juin 2000.
BibTeX
Philippe Joly, Hae-Kwang Kim
Efficient Automatic Analysis of Camera Work and Microsegmentation of Video Using Spatio-Temporal Images
Dans : Signal Processing : Image Communication, Elsevier, Eurasip, Amsterdam, Vol. 8(4), mai 1996.
BibTeX

International conferences articles

Modan Tailleur, Julien Pinquier, Laurent Millot, Corsin Vogel, Mathieu Lagrange

EMVD dataset: a dataset of extreme vocal distortion techniques used in heavy metal

21st International Conference on Content-based Multimedia Indexing (CBMI 2024), Sep 2024, Reykjavik, Iceland

Accès: https://hal.science/hal-04620072

Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier

Detection of Pharyngolaryngeal Activities in Real-World Settings Using Wearable Sensors

46th annual international conference of the IEEE engineering in medicine and biology society (EMBC 2024), EMBC: Engineering in Medicine and Biology Society, Jul 2024, Orlando (Florida), United States. à paraître

Accès: https://hal.science/hal-04561003

Adrien Lafore, Clément Pagés, Leila Moudjari, Sebastião Quintas, Isabelle Ferrané, Hervé Bredin, Thomas Pellegrini, Farah Benamara, Jérôme Bertrand, Marie-Françoise Bertrand, Véronique Moriceau, Jérôme Farinas

Premier système IRIT-MyFamillyUp pour la compétition sur la reconnaissance des émotions Odyssey 2024

35èmes Journées d’Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024), Université Toulouse 3 Paul Sabatier; Université Toulouse Jean Jaurès, Jul 2024, Toulouse, France. pp.502-511

Accès: https://hal.science/hal-04594251

Taissir Fekih Romdhane, Mohamed Ibn Khedher, Mounim A El-Yacoubi

PredictStr: a balanced benchmark dataset for improve stroke prediction

16th International Conference on Human System Interaction (HSI), Jul 2024, Paris, France

Accès: https://hal.science/hal-04622267

Sylvain Detey, Verdiana De Fino, Lionel Fontan

Morphophonological ambiguities and automatic assessment of spoken L2 lexical forms for pedagogical purposes: a pilot study among Japanese learners of French

33rd Conference of the European Second Language Association (EuroSLA 2024), Université Montpellier; European Second Language Association (EuroSLA), Jul 2024, Montpellier, France

Accès: https://shs.hal.science/halshs-04580503

Adrien Lafore, Clément Pagés, Leila Moudjari, Sebastião Quintas, Hervé Bredin, Thomas Pellegrini, Farah Benamara, Isabelle Ferrané, Jérôme Bertrand, Marie-Françoise Bertrand, Véronique Moriceau, Jérôme Farinas

IRIT-MFU Multi-modal systems for emotion classification for Odyssey 2024 challenge

Odyssey 2024: The Speaker and Language Recognition Workshop, Jun 2024, Québec, Canada. pp.296-302, ⟨10.21437/odyssey.2024-42⟩

Accès: https://hal.science/hal-04594287

Joonas Kalda, Clément Pagés, Ricard Marxer, Tanel Alumäe, Hervé Bredin

PixIT: Joint Training of Speaker Diarization and Speech Separation from Real-world Multi-speaker Recordings

The Speaker and Language Recognition Workshop (Odyssey 2024), Jun 2024, Quebec City, France. pp.115-122, ⟨10.21437/odyssey.2024-17⟩

Accès: https://hal.science/hal-04649858

Martin Lebourdais, Marie Tahon, Antoine Laurent, Sylvain Meignier

Automatic Speech Interruption Detection: Analysis, Corpus, and System

Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-Coling 2024), ELRA Language Resources Association (ELRA); International Committee on Computational Linguistics (ICCL), May 2024, Torino, Italy. à paraître

Accès: https://hal.science/hal-04576488

Ismail Khalfaoui-Hassani, Timothée Masquelier, Thomas Pellegrini

Audio classification with Dilated Convolution with Learnable Spacings

NeurIPS 2023 – Workshop on Machine Learning for Audio, Dec 2023, New Orleans, United States

Accès: https://inria.hal.science/hal-04314269

Marvin Lavechin, Marianne Métais, Hadrien Titeux, Alodie Boissonnet, Jade Copet, Morgane Rivière, Elika Bergelson, Alejandrina Cristia, Emmanuel Dupoux, Hervé Bredin

Brouhaha: multi-task training for voice activity detection, speech-to-noise ratio, and C50 room acoustics estimation

IEEE Automatic Speech Recognition and Understanding (ASRU 2023 ), IEEE, Dec 2023, Taipei, Taiwan. pp.1–7

Accès: https://hal.science/hal-04247647

National conferences articles

Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales

31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.102-111

Accès: https://inria.hal.science/hal-04623063

Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané

Erreurs de prononciation en L2 : comparaison de méthodes pour la détection et le diagnostic guidés par la didactique

31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.361-370

Accès: https://inria.hal.science/hal-04623087

Lucas Block Medin, Lucile Gelin, Thomas Pellegrini

Adaptation de modèles auto-supervisés pour la reconnaissance de phonèmes dans la parole d’enfant

31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.231-241

Accès: https://inria.hal.science/hal-04623075

Mathieu Balaguer, Lucile Gelin, Clémence Devoucoux, Camille Galant, Muriel Lalain, Alain Ghio, Jérôme Farinas, Julien Pinquier, Virginie Woisard

Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes

31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.61-70

Accès: https://inria.hal.science/hal-04623060

Verdiana De Fino, Isabelle Ferrané, Julien Pinquier, Lionel Fontan

Peut-on évaluer la compréhensibilité de la parole sans référence quant aux intentions de communication du locuteur ? Une étude auprès d’apprenants germanophones de FLE

31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.492-501

Accès: https://inria.hal.science/hal-04623099

Verdiana De Fino, Isabelle Ferrané, Lionel Fontan, Julien Pinquier

Prédiction de la compréhensibilité de la parole d’apprenants de français

Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France

Accès: https://hal.science/hal-04329163

Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané

Détection et classification automatiques d’erreurs de prononciation en L2 : approche basée sur les connaissances didactiques

Accès: https://hal.science/hal-04331354

Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier

Evaluation de la détection automatique des activités pharyngolaryngées dans les signaux d’auscultation cervicale à haute résolution chez les personnes âgées

3ème journée de la Société Française de Déglutition et de Dysphagie (SF2D 2023), Société Française de Déglutition et de Dysphagie, Nov 2023, Toulouse, France

Accès: https://hal.science/hal-04560917

Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

Mesure du trouble de parole dans le suivi cancérologique grâce à la reconnaissance automatique de la parole

55e Congrès de la Société Française de Chirurgie Cervico-Faciale (SFCCF 2023), Université de Nantes; Société Française de Chirurgie Cervico-Faciale, Nov 2023, Nantes, France

Accès: https://hal.science/hal-04297963

Mathieu Balaguer

Parole et communication après cancer oral ou oropharyngé : l’évaluation clinique au cours du suivi du patient

58e Congrès Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale (2023), Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale, Oct 2023, Toulouse, France

Accès: https://hal.science/hal-04230870

Books

Etienne Sicard, Anne Menin-Sicard, Marie Daumet, Stéphanie Perriere, Océane Barbera

Evaluation de la voix avant/après suivi orthophonique -à propos de la méthodologie d’évaluation et de la fiabilité des mesures chiffrées

Ortho Editions. Efficacité des thérapies, Ortho Editions, pp.233-264, 2017, 978-2-36235-100-6

Accès: https://hal.science/hal-02424850

Alexandre Boyer, Etienne Sicard

Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC

Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1

Accès: https://hal.science/hal-01951651

Books parts

Marie Garnier
Automatic correction of adverb placement errors for CALL
In : Eurocall12. G Lund (Eds.) , EUROCALL Association, (electronic medium), July 2012.
BibTeX
Hervé Bredin, Aurélien Mayoue, Gérard Chollet
Talking-Face Verification
In : Guide to Biometric Reference Systems and Performance Evaluation. Dijana Petrovska, Gérard Chollet, Bernadette Dorizzi (Eds.) , Springer, 10, pp. 297-326, 2009.
BibTeX
Brice Burger, Isabelle Ferrané, Frédéric Lerasle
Towards multimodal interface for interactive robots: challenges and robotic systems description
In : Cutting Edge Robotics 2009. Kordic Vedran (Eds.) , INTECH, (on line), August 2009.
URL : http://intechweb.org/invitations.php?code=4b5cb9fc911b854ff9bd08e5a7ad866f&PHPSESSID=7d013daoo3i48pshqjg610amf7
BibTeX
Khalid Daoudi
Iterated Function Systems and some generalizations: Local Regularity Analysis and Multifractal Modeling of Signals
In : Scaling Laws, Fractals and Wavelets. Patrice Abry, Paulo Gonçalves, Jacques Lévy Véhel (Eds.) , ISTE – WILEY, pp. 301-332, January 2009.
BibTeX
Gérard Chollet, Rémi Landais, Thomas Hueber, Hervé Bredin, Chafic Mokbel, Patrick Perrot, Leila Zouari
Some Experiments in Audio-Visual Speech Processing
In : Advances in Nonlinear Speech Processing. Mohamed Chetouani (Eds.) , Springer-Verlag, pp. 28-56, Vol. 4885/2007, LNCS, 2007.
BibTeX
Bouchra Abboud, Hervé Bredin, Guido Aversano , Gérard Chollet
Audio-visual Identity Verification: An Introductory Overview
In : Progress in Nonlinear Speech Processing. Yannis Stylianou, Marcos Faundez-Zanuy, Anna Eposito (Eds.) , Springer-Verlag, pp. 118-134, Vol. 4391/2007, LNCS, 2007.
BibTeX
Philippe Joly
Descriptions des séquences d’images
In : L’indexation multimédia Description et recherche automatiques. P. Gros (Eds.) , Hermès, pp. 119-136, Traité IC2, série Traitement du signal et de l’image, May 2007.
BibTeX
Jorge Gutierrez, Jean-Luc Rouas, Régine André-Obrecht
Application of uncertainty-based methods to fuse language identification expert decision
In : Modern Information Processing: From Theory to Application (Selected Papers of the IPMU’2004). B. Bouchon-Meunier, G. Coletti, R.R. Yager (Eds.) , Elsevier, pp. 255-268, 2006.
BibTeX
Farah Benamara, Véronique Moriceau
Prepositions in Cooperative Question-Answering Systems: a Preliminary Analysis
In : Syntax and semantics of prepositions. Patrick Saint-Dizier (Eds.) , Springer, pp. 307-330, Vol. 29, Text, Speech and Language Technology, November 2006.
URL : http://www.springerlink.com/content/978-1-4020-3873-0
BibTeX
Philippe Joly
Enjeux d’une normalisation pour l’indexation des contenus multimédia
In : Paradigmes et enjeux de l’informatique. N Bidoit, L Fariñas del Cerro, S Fdida, B Vallée (Eds.) , Hermès Science, pp. 157-169, Informatique et Systèmes d’Information, February 2005.
BibTeX

Proceedings

Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

Actes de JEP-TALN-RECITAL 2024. 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 2 : traductions d’articles publiés

35èmes Journées d’Études sur la Parole (JEP) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), ATALA & AFPC, 2024

Accès: https://inria.hal.science/hal-04622991

Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

Actes de JEP-TALN-RECITAL 2024. Actes des 35èmes Journées d’Études sur la Parole

Accès: https://inria.hal.science/hal-04623053

Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

Actes de JEP-TALN-RECITAL 2024. 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position

Accès: https://inria.hal.science/hal-04623005

Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-Dac, Julie Mauclair, José G. Moreno, Julien Pinquier

Actes de JEP-TALN-RECITAL 2024. Actes de la 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues

Accès: https://inria.hal.science/hal-04622982

Mathieu Balaguer, Lila Gravellier, Julien Pinquier

Actes des 9èmes Journées de Phonétique Clinique

Institut de Recherche en Informatique de Toulouse, 2023, 978-2-917490-35-8

Accès: https://hal.science/hal-04126591v2

Mathieu Lagrange, Annamaria Mesaros, Thomas Pellegrini, Gael Richard, Romain Serizel, Dan Stowell

Proceedings of the 7th Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE 2022)

Tampere University, pp.1-225, 2022, 978-952-03-2677-7

Accès: https://inria.hal.science/hal-03850901

Conferences Proceedings

Philippe Aigrain, Philippe Joly, Véronique Longueville
Medium Knowledge-Based Macrosegmentation of Video into Sequences in Proc. of IJCAI’95: Workshop on Intelligent Multimedia Information Retrieval, –, Mark Maybury, Montréal, August 1995.
BibTeX

Thesis and HDR

Verdiana De Fino

Caractérisation et mesure de la compréhensibilité de la parole de locuteurs non natifs dans le cadre de l’apprentissage des langues

Informatique. Université Paul Sabatier – Toulouse III, 2024. Français. ⟨NNT : ⟩

Accès: https://hal.science/tel-04582745

Jérôme Farinas

La parole : du traitement automatique à la mesure de l’intelligibilité

Intelligence artificielle [cs.AI]. Université Paul Sabatier (Toulouse 3), 2023

Accès: https://hal.science/tel-04381096

Benjamin Chamand

Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30104⟩

Accès: https://theses.hal.science/tel-04229622

Robin Vaysse

Caractérisation automatique du rythme de la parole : application aux cancers des voies aéro-digestives supérieures et à la maladie de Parkinson

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30062⟩

Accès: https://theses.hal.science/tel-04198849

Sebastião Quintas

Deep learning approaches to assess speech intelligibility of head and neck cancer

Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30272⟩

Accès: https://theses.hal.science/tel-04094765

Estelle Randria

Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?

Informatique [cs]. Université Paul Sabatier (Toulouse 3), 2022. Français. ⟨NNT : 2022TOU30258⟩

Accès: https://theses.hal.science/tel-04064038

Vincent Roger

Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond : d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique

Apprentissage [cs.LG]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30180⟩

Accès: https://theses.hal.science/tel-03935738

Lucile Gelin

Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes

Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30031⟩

Accès: https://theses.hal.science/tel-03715653

Léo Cances

Apprentissage profond faiblement supervisé et semi-supervisé pour la détection d’évènements sonores

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30262⟩

Accès: https://theses.hal.science/tel-03683219

Timothy Pommée

Les mesures d’intelligibilité : état de l’art, considérations pratiques pour l’applicabilité clinique et explorations acoustiques

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30141⟩

Accès: https://theses.hal.science/tel-04136563

Reports

Etienne Sicard, Anne Menin-Sicard

La diadococinésie et son application en orthophonique clinique

[Rapport de recherche] INSA 2020, INSA : Institut National des Sciences Appliquées de Toulouse. 2020

Accès: https://hal.science/hal-02512856

Etienne Sicard, Anne Menin-Sicard

Analyse de la qualité des phrases pour un bilan objectif de la parole

[Rapport de recherche] INSA Toulouse. 2019

Accès: https://hal.science/hal-02389764v2

Thomas Pellegrini, Céline Manenti, Julien Pinquier

The IRIT-UPS system @ ZeroSpeech 2017

[Research Report] IRIT. 2017

Accès: https://hal.science/hal-03131886

Maëlys Salingre, Jérôme Farinas, Stéphane Rabant

Automatic identification of French regional accent

[Rapport de recherche] IRIT. 2017

Accès: https://hal.science/hal-03120304

Reports

Archange Giscard Destiné
Recherche des expressions clés caractéristiques de linteraction entre locuteurs dans les documents audiovisuels
Master’s report, Université Paul Sabatier, June 2011.
Abstract URL : http://www.irit.fr/publis/SAMOVA/M2R/Memoire_M2R_ArchangeDestine.pdf
BibTeX
Noureddine Besbes
Indexation en intervenant d’un document vidéo par identification du visage
Master’s report, Université Paul Sabatier, June 2007.
URL : http://www.irit.fr/publis/SAMOVA/Memoire_M2R_Noureddine.pdf
BibTeX
Ihab Mallak
Description de comportements humains et interrogation.
Master’s report, Université de Toulouse, June 2006.
URL : http://www.phdgroup.org/ul-stsi-2005-2006.php
BibTeX
Hélène Lachambre
Caractérisation de la voix chantée
Master’s report, Institut National Polytechnique de Toulouse, June 2006.
BibTeX
Ali Mcheik
Application des matrices de similarité à la comparaison de contenus sonores
Master’s report, Université Paul Sabatier, June 2006.
BibTeX
Elie El Khoury
Segmentation et regroupement en locuteurs d’un document sonore
Master’s report, Université Paul Sabatier, June 2006.
BibTeX
Jeremy Philippeau
Caractérisation d’un intervenant dans un document audiovisuel
Internship report, Master Recherche 2IH, Université Paul Sabatier, June 2005.
BibTeX
Loïc Lefloch
Etude constractive de décodeurs acoustico-phonétique
Internship report, Master Recherche 2IH, Université Paul Sabatier, June 2005.
BibTeX
Christine Senac
Contribution à l’indexation multimedia
Research report, IRIT/2005-8-R, IRIT, March 2005.
BibTeX
José Anibal Arias
Méthodes à vecteurs de support et indexation sonore
Internship report, DEA IIL, Université Paul Sabatier, 2004.
BibTeX

Acronym	Title	Resp. sc	Start-End year
VOICE4PD – MSA	Diagnostic différentiel entre la maladie de Parkinson et latrophie multisystématisée par analyse numérique de la parole	Julie MAUCLAIR	2016 – 2024
PhLEs-NID	Dispositif non invasif evaluant l’éfficacité pharyngo-laryngée	Jérôme FARINAS	2022 – 2026
CHICA-AI	Training CHIldren reading Comprehension skills with Adapted Artificial Intelligence	Thomas PELLEGRINI	2023 – 2027
ANR CONNECTS RUGBI	Convention de reversement de fonds dans le cadre du projet ANR CONNECTS – Projet RUGBI	Jérôme FARINAS	2024 – 2025
ADAPT [Contract completed]	AAP Carnot Cognition : Aide à l’Analyse et au DiAgnostic de la Parole pathologique pour les Thérapeutes	Julien PINQUIER	2023 – 2023
PATY [Contract completed]	AAP Carnot Cognition : Plateforme de traitement de parole atypique	Jérôme FARINAS	2021 – 2021
Park-MSA [Contract completed]	AAP Carnot Cognition : Park-MSA	Julie MAUCLAIR	2020 – 2021
2018382 [Contract completed]	Google Faculty Research Award : Low-latency online speakerdiarization	Hervé BREDIN	2020 – 2022
LabCom : ALAIA [Contract completed]	Laboratoire Commun : Apprentissage des Langues Assisté par Intelligence Artificielle	Isabelle FERRANÉ	2019 – 2023
LinTo [Contract completed]	Assistant vocal open-source respectueux des données personnelles pour lentreprise	Isabelle FERRANÉ	2018 – 2021
LUDAU [Contract completed]	Découverte peu et non-supervisée d’unités audio à l’aide d’apprentissage profond	Thomas PELLEGRINI	2018 – 2023
RUGBI [Contract completed]	Recherche d’unités linguistiques pertinentes pour améliorer la mesure de l’intelligibilité de la parole altérée par des troubles de production pathologique	Jérôme FARINAS	2018 – 2023
CIESS [Contract completed]	Contribution, indexation, et enrichissement d’un corpus de sons de l’environnement	Régine ANDRÉ-OBRECHT	2013 – 2016
DIADEMS [Contract completed]	Description, Indexation, Accés aux Documents Ethnomusicologiques et Sonores	Régine ANDRÉ-OBRECHT	2013 – 2016

Acronym	Title	Resp. sc	Start-End year
pyannote.mobile	On-device streaming speaker diarization	Hervé BREDIN	2024 – 2024
TAPAS [Contract completed]	Training Network on Automatic Processing of PAthological Speech	Julie MAUCLAIR	2017 – 2022
VICTORIA [Contract completed]	Video analysis for Investigation of Criminal and TerrORIst Activities	Philippe JOLY	2017 – 2020

Acronym	Title	Resp. sc	Start-End year
AUDIOCAP [Contract completed]	Audition et handicap dans le bruit vers la restauration de lintelligibilité de la parole	Julien PINQUIER	2019 – 2022
EVOLEX2 [Contract completed]	Apport de la reconnaissance vocale pour le diagnostic de dysfonctionnements cognitifs légers	Julien PINQUIER	2019 – 2021
INGPRO [Contract completed]	Recherche et Sociétés : Incidence des gestes sur la prononciation	Isabelle FERRANÉ	2019 – 2021
SAMI [Contract completed]	Allocation Doctorale : Système automatisé de mesure de lintelligibilité	Julien PINQUIER	2018 – 2021
ECREME [Contract completed]	Allocation Doctorale : Expertises Musicale et Cognitive pour Recommandation Musicale personnaliséE	Julien PINQUIER	2017 – 2020
PHONICS [Contract completed]	CLE : Intelligent Electronic Device for Measuring Speech Comprehension	Jérôme FARINAS	2014 – 2018

Wednesday 3 April 2024, 9h00

Description automatique des événements sonores par des méthodes d’apprentissage profond – CoNeTTE, un système d’Audio Captioning générique

Etienne LABBÉ – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Friday 15 March 2024, 9h00

Dilated Convolution with Learnable Spacings (DCLS)

Ismail KHALFAOUI HASSANI – Team SAMOVA, IRIT Centre de Recherche Cerveau et Cognition (CerCo), Toulouse

#these

Monday 11 March 2024, 14h00

Caractérisation et mesure de la compréhensibilité de la parole de locuteurs non natifs dans le cadre de l’apprentissage des langues

Verdiana DE FINO – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Tuesday 16 May 2023, 10h00

Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons

Benjamin CHAMAND – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Tuesday 21 March 2023, 9h00

Automatic characterisation of speech rhythm: application to Head and Neck cancers and Parkinson’s disease

Robin VAYSSE – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Wednesday 30 November 2022, 14h00

Deep Learning Approaches to Assess Speech Intelligibility of Head and Neck Cancers

Sebastiao QUINTAS – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Monday 17 October 2022, 14h00

Comprehensibility of audiovisual contents: which approaches for an objective measurement?

Estelle RANDRIA – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Thursday 29 September 2022, 14h00

Modeling the severity index of speech impairment using deep learning methods A modeling from few examples to an entropic measure via self-supervised learning

Vincent ROGER – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Wednesday 2 February 2022, 14h00

Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes

Lucile GELIN – Team SAMOVA, IRIT UT3 Paul Sabatier, IMT, Bât 1R3, Amphi. Schwartz

#these

Tuesday 14 December 2021, 14h00

Apprentissage profond faiblement et semi-supervisé pour la détection d’évènements sonores

Leo CANCES – Team SAMOVA, IRIT UT3 Paul Sabatier, IMT, Bât 1R3, Amphi. Schwartz

#these

Monday 8 July 2024 – Friday 12 July 2024

Conférence francophone JEP-TALN-RECITAL 2024

UT2 Jean Jaurès

#congres Know more

Thursday 9 January 2020 – Friday 10 January 2020

12th Speech In Noise Workshop

Hôtel-Dieu Saint-Jacques, Toulouse

#congres Know more

Monday 4 July 2016 – Friday 8 July 2016

Journées d’Etudes sur la Parole

INALCO, 75013 Paris

#congres Know more

Thursday 21 February 2019, 11h00 – 12h00

Weakly-supervised approaches for sound event detection

Thomas PELLEGRINI – Team SAMOVA – IRIT (France) INP-ENSEEIHT, Salle des thèses

#seminaire

Wednesday 31 August 2016, 10h00 – 12h00

Advanced human robot social interaction: goals, challenges and approaches

Sarah COSENTINO – Waseda University (Japon) UT3 Paul Sabatier, IRIT, Salle des Thèses

#seminaire

Monday 20 April 2015, 13h30

Analyse de signaux multi-composantes: avancées théoriques et applications musicales

Dominique FOURER UT3 Paul Sabatier, IRIT, Salle des Thèses

#seminaire

Thursday 21 December 2023, 10h00

La parole : du traitement automatique à la mesure de l’intelligibilité

Jérôme FARINAS – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#hdr

Thursday 15 June 2023 – Saturday 17 June 2023

9es Journées de Phonétique Clinique (JPC2023)

UT2 Jean Jaurès, Maison de la Recherche

#journee

Thursday 27 May 2021

Séminaire AFCP — Phonétique Clinique (en remplacement de JPC2021)

UT3 Paul Sabatier, En visioconférence

#journee

Wednesday 4 September 2019 – Friday 6 September 2019

Training Network on Automatic Processing of PAthological Speech (TAPAS) TE3: Data Collection, Management and Ethical Practices

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

Thursday 4 October 2018

2018 AIRBUS Air Traffic Control Challenge Workshop

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

Thursday 8 March 2018

Traitement automatique de la parole et ressources pour la didactique de l’oral en L2 : variation, corpus, techniques

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

Wednesday 4 October 2017

Workshop Language Didactics, Gestures & CALL

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

SAMOVA Team

skills

team Members

team publications

team Contracts