SAMOVA Team

Head : Julien PINQUIER

Permanent members

Régine ANDRÉ-OBRECHTProfessor Emérite (HDR) – UT3
Hervé BREDINResearch Scientist – CNRS
Jérôme FARINASAssociate Professor (HDR) – UT3
Isabelle FERRANÉAssociate Professor – UT3
Philippe JOLYProfessor – UT3
Julie MAUCLAIRAssociate Professor – UT3
Thomas PELLEGRINIAssociate Professor – UT3
Julien PINQUIERAssociate Professor (HDR) – UT3
Christine SENACAssociate Professor – UT3

Non-permanent members

Philippe ALLETPhD Student – UT3
Elie BANIDEIntern M2 – Université Paris Est Créteil
Anaïs BOULZEIntern M1 – UT3
Romain CONTRAINResearch Engineer – UT3
Lila GRAVELLIERPhD Student – UT3
Gayane KHARATYANIntern M1 – UT3
Adrien LAFOREPhD Student – UT3 (joint direction MELODI)
Martin LEBOURDAISContractual Researcher – CNRS
Maelys LEIÇARRAGUEIntern L – UT3
Clément PAGESDevelopment Engineer – CNRS
Jim PETIOTDevelopment Engineer – UT3
Alexis PLAQUETPhD Student – UT3
Sebastiao QUINTASContractual Researcher – ANITI
Ludovic TUNCAYPhD Student – UT3

External members

Mathieu BALAGUERResearch Engineer Associé – UT3
Lucile GELINGuest Researcher – Lalilo
Etienne LABBÉYoung doctor IRIT – UT3

International journals articles

Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

Automatic modelling of perceptual judges in the context of head and neck cancer speech intelligibility

International Journal of Language and Communication Disorders, 2024, pp.1–14. ⟨10.1111/1460-6984.13004⟩

Accès: https://hal.science/hal-04405083

Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

Development of a holistic communication score (HoCoS) in patients treated for oral or oropharyngeal cancer: Preliminary validation

International Journal of Language and Communication Disorders, 2023, 58 (1), pp.39-51. ⟨10.1111/1460-6984.12766⟩

Accès: https://hal.science/hal-03765649v2

Lionel Pibre, Jorge Francisco Madrigal Diaz, Cyrille Equoy, Frédéric Lerasle, Thomas Pellegrini, Julien Pinquier, Isabelle Ferrané

Audio-video fusion strategies for active speaker detection in meetings

Multimedia Tools and Applications, 2022, 2022, pp.1-26. ⟨10.1007/s11042-022-13746-7⟩

Accès: https://hal.science/hal-03792965

Léo Cances, Etienne Labbé, Thomas Pellegrini

Comparison of Semi-supervised Deep Learning Algorithms for Audio Classification

EURASIP Journal on Audio, Speech, and Music Processing, 2022, 2022 (1, article 23), pp.1-14. ⟨10.1186/s13636-022-00255-6⟩

Accès: https://hal.science/hal-03855042

Vincent Roger, Jérôme Farinas, Julien Pinquier

Deep neural networks for automatic speech processing: a survey from large corpora to limited data

EURASIP Journal on Audio, Speech, and Music Processing, 2022, article 19, pp.1-15. ⟨10.1186/s13636-022-00251-w⟩

Accès: https://hal.science/hal-03755976

Mathieu Balaguer, Timothy Pommée, Julien Pinquier, Jérôme Farinas, Virginie Woisard, Florence Sordes

Development and preliminary validation of the questionnaire ‘Evaluation of the constitution of social circles (ECSC)’ in patients treated for cancer of the upper aerodigestive tract

Folia Phoniatrica et Logopaedica, 2022, 75 (1), pp.52-66. ⟨10.1159/000525352⟩

Accès: https://hal.science/hal-03716864

Lionel Fontan, Libio Gonçalves Braz, Julien Pinquier, Michael Stone, Christian Füllgrabe

Using Automatic Speech Recognition to Optimize Hearing-Aid Time Constants

Frontiers in Neuroscience, 2022, 16 (779062), ⟨10.3389/fnins.2022.779062⟩

Accès: https://hal.science/hal-03627441

Libio Gonçalves Braz, Lionel Fontan, Julien Pinquier, Michael A Stone, Christian Füllgrabe

OPRA-RS: A Hearing-Aid Fitting Method Based on Automatic Speech Recognition and Random Search

Frontiers in Neuroscience, 2022, 16, pp.779048. ⟨10.3389/fnins.2022.779048⟩

Accès: https://ut3-toulouseinp.hal.science/hal-03582025

Renée Speyer, Anna-Liisa Sutt, Liza Bergström, Shaheen Hamdy, Timothy Pommée, Mathieu Balaguer, Anett Kaale, Reinie Cordier

Neurostimulation in People with Oropharyngeal Dysphagia

Journal of Clinical Medicine, 2022, Special issue : Advances in Management of Voice and Swallowing Disorders, 11 (4), pp.993. ⟨10.3390/jcm11040993⟩

Accès: https://ut3-toulouseinp.hal.science/hal-03581586

Chems-Eddine Himeur, Thibault Lejemble, Thomas Pellegrini, Mathias Paulin, Loic Barthe, Nicolas Mellado

PCEDNet : A Lightweight Neural Network for Fast and Interactive Edge Detection in 3D Point Clouds

ACM Transactions on Graphics, 2022, 41 (1), pp.1-21. ⟨10.1145/3481804⟩

Accès: https://hal.science/hal-03349971

National journals articles

Mathieu Balaguer, Timothy Pommée, Jérôme Farinas, Julien Pinquier, Virginie Woisard

Paramètres perceptifs expliquant la sévérité du trouble de parole mesurée automatiquement en cancérologie ORL

Rééducation orthophonique, 2021, Chapitre : “De l’exploration à la prise en soins de la voix chez l’adulte : données actuelles.. sur la voie des voix”, 286, pp.1-13

Accès: https://ut3-toulouseinp.hal.science/hal-03277422

Mathieu Balaguer, Josiane Percodani, Virginie Woisard

Le Carcinologic Handicap Index (CHI) : questionnaire d’autoévaluation du handicap à destination des patients traités pour cancer des VADS

Annales françaises d’Oto-rhino-laryngologie et de Pathologie Cervico-faciale, 2017, 134 (6), pp.382-387. ⟨10.1016/j.aforl.2016.07.021⟩

Accès: https://hal.science/hal-02553232

National journals articles

Sylvain Detey, Lionel Fontan, Thomas Pellegrini
Traitement de la prononciation en langue étrangère : approches didactiques, méthodes automatiques et enjeux pour l’apprentissage
In : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 57, N. 3, (on line), 2016.
URL : https://www.atala.org/Traitement-de-la-prononciation-en – https://oatao.univ-toulouse.fr/19173/
BibTeX
Lionel Fontan, Cynthia Magnen, Julien Tardieu, Isabelle Ferrané, Julien Pinquier, Jérôme Farinas, Pascal Gaillard, Xavier Aumont
Comparaison de mesures perceptives et automatiques de l’intelligibilité : application à de la parole simulant la presbyacousie
In : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 55, N. 2, pp. 151-174, March 2015.
Abstract URL : http://www.atala.org/Comparaison-de-mesures-perceptives – https://oatao.univ-toulouse.fr/15274/
BibTeX
Blandine Boudet, Thérèse Giacobini, Isabelle Ferrané, Carine Fortin, Christophe Mollaret, Frédéric Lerasle, Pierre Rumeau
Quels sont les objets égarés à domicile par les personnes âgées fragiles ? Une étude pilote sur 60 personnes.
In : Neurologie – Psychiatrie – Gériatrie (NPG), Elsevier, Vol. Vol. 14/79, pp. 38-42, 2014.
URL : https://oatao.univ-toulouse.fr/13000/
BibTeX
David Janiszek, Damien Pellier, Julie Mauclair, Laetitia Boulc’H, Jean-Louis Baron, Yannick Parchemal
Utilisation de la robotique pédagogique pour enseigner l’intelligence artificielle : une expérience d’approche par projet auprès d’étudiants en informatique.
In : Sciences et Technologies de l’Information et de la Communication pour l’Éducation et la Formation (STICEF), Association des Technologies de l’Information pour l’Education et la Formation, Paris, Vol. 18, (on line), 2011.
URL : http://sticef.univ-lemans.fr/num/vol2011/07r-janiszek/sticef_2011_janiszek_07rp.html
BibTeX
Jérôme Farinas, Jean-Luc Rouas, François Pellegrino, Régine André-Obrecht
Extraction automatique de paramètres prosodiques pour l’identification automatique des langues
In : Traitement du Signal, GRETSI : Groupement de Recherche en Traitement du Signal et des Images, Vol. 22, N. 2, pp. 81-97, 2005.
URL : http://documents.irevues.inist.fr/bitstream/handle/2042/2443/02%22Andr%E9-Obrecht+couleur.pdf?sequence=1
BibTeX
Julien Pinquier, Jean-Luc Rouas, Régine André-Obrecht
Fusion de paramètres pour une classification automatique parole/musique robuste
In : Technique et science informatiques (TSI) : Fusion numérique/symbolique, Hermès, 8, quai du marche neuf, F-75004 Paris, Vol. 22, pp. 831-852, 2003.
BibTeX
Régine André-Obrecht, Abdelouafi Meziane, Bruno Jacob
Modélisation de la durée des sons dans un système de reconnaissance automatique de la parole
In : Comptes Rendus de l’Académie des Sciences, Académie des Sciences, Elsevier, Paris, Vol. t327 série IIb, pp. 379-382, 1999.
BibTeX

Special issues of journal

Philippe Ercolessi, Christine Senac, Hervé Bredin, Sandrine Mouysset
Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d’histoires
Dans : Revue des Sciences et Technologies de l’Information, Hermès Science, Vol. 15 N. 2, pp. 41-66, 2012.
URL : http://www.irit.fr/publis/SAMOVA/
BibTeX
Ebroul Iquierdo, Jenny Bennois-Pineau, Régine André-Obrecht
Special Issue on Content Based Multimedia Indexing and Retrieval
Dans : Signal Processing: Image Communication, Elsevier, Vol. 22, Issues 7-8, 2007.
BibTeX
Régine André-Obrecht
Special Issue on Speaker Recognition and its Commercial and Forensic Applications
Dans : International Journal Speech Communication, N.H Elsevier ISSN 0167-6393, North Holland, Vol. 31, Nos 2-3, juin 2000.
BibTeX
Philippe Joly, Hae-Kwang Kim
Efficient Automatic Analysis of Camera Work and Microsegmentation of Video Using Spatio-Temporal Images
Dans : Signal Processing : Image Communication, Elsevier, Eurasip, Amsterdam, Vol. 8(4), mai 1996.
BibTeX

International conferences articles

Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier

Detection of Pharyngolaryngeal Activities in Real-World Settings Using Wearable Sensors

46th annual international conference of the IEEE engineering in medicine and biology society (EMBC 2024), EMBC: Engineering in Medicine and Biology Society, Jul 2024, Orlando (Florida), United States. à paraître

Accès: https://hal.science/hal-04561003

Marvin Lavechin, Marianne Métais, Hadrien Titeux, Alodie Boissonnet, Jade Copet, Morgane Rivière, Elika Bergelson, Alejandrina Cristia, Emmanuel Dupoux, Hervé Bredin

Brouhaha: multi-task training for voice activity detection, speech-to-noise ratio, and C50 room acoustics estimation

IEEE Automatic Speech Recognition and Understanding (ASRU 2023 ), IEEE, Dec 2023, Taipei, Taiwan. pp.1–7

Accès: https://hal.science/hal-04247647

Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

Can we use speaker embeddings on spontaneous speech obtained from medical conversations to predict intelligibility?

IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2023), IEEE, Dec 2023, Taipei, Taiwan. à paraître

Accès: https://hal.science/hal-04230836

Ismail Khalfaoui-Hassani, Timothée Masquelier, Thomas Pellegrini

Audio classification with Dilated Convolution with Learnable Spacings

NeurIPS 2023 – Workshop on Machine Learning for Audio, Dec 2023, New Orleans, United States

Accès: https://inria.hal.science/hal-04314269

Verdiana De Fino

Automatic assessment of L2 speech from proficiency to comprehensibility: illustration among Japanese learners of French

Speech assessment and native and non-native linguistic variation (2023), Oct 2023, Tokyo (JP), Japan

Accès: https://hal.science/hal-04329222

Etienne Labbé, Thomas Pellegrini, Julien Pinquier

Killing two birds with one stone: can an audio captioning system also be used for audio-test retrieval?

8th workshop on Detection and Classification of Acoustic Scenes and Events (DCASE2023), Sep 2023, Tampere, Finland

Accès: https://hal.science/hal-04180972

Etienne Labbé, Julien Pinquier, Thomas Pellegrini

Multitask learning in Audio Captioning: a sentence embedding regression loss acts as a regularizer

31st European Signal Processing Conference (EUSIPCO 2023), Sep 2023, Helsinki, Finland. ⟨10.48550/arXiv.2305.01482⟩

Accès: https://hal.science/hal-04207519

Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier

Détection automatique de la déglutition dans les signaux d’auscultation cervicale à haute résolution

XXIXème Colloque Francophone de Traitement du Signal et des Images (GRETSI 2023), Association GRETSI : Groupe de recherche et d’études du traitement du signal et des images, Aug 2023, Grenoble, France. pp.1–4

Accès: https://hal.science/hal-04555536

Marvin Lavechin, Yaya Sy, Hadrien Titeux, María Andrea Cruz Blandón, Okko Räsänen, Hervé Bredin, Emmanuel Dupoux, Alejandrina Cristia

BabySLM: language-acquisition-friendly benchmark of self-supervised spoken language models

INTERSPEECH 2023, Aug 2023, Dublin, Ireland. pp.4588-4592, ⟨10.21437/Interspeech.2023-978⟩

Accès: https://hal.science/hal-04247612

Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

Development of a holistic communication score (HoCoS) in patients treated for oral or oropharyngeal cancer: preliminary validation

32nd World Congress of the IALP (2023), IALP: International Association of Communication Sciences and Disorders, Aug 2023, Auckland, New Zealand

Accès: https://hal.science/hal-04221418

National conferences articles

Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané

Détection et classification automatiques d’erreurs de prononciation en L2 : approche basée sur les connaissances didactiques

Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France

Accès: https://hal.science/hal-04331354

Verdiana De Fino, Isabelle Ferrané, Lionel Fontan, Julien Pinquier

Prédiction de la compréhensibilité de la parole d’apprenants de français

Accès: https://hal.science/hal-04329163

Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

Mesure du trouble de parole dans le suivi cancérologique grâce à la reconnaissance automatique de la parole

55e Congrès de la Société Française de Chirurgie Cervico-Faciale (SFCCF 2023), Université de Nantes; Société Française de Chirurgie Cervico-Faciale, Nov 2023, Nantes, France

Accès: https://hal.science/hal-04297963

Mathieu Balaguer

Parole et communication après cancer oral ou oropharyngé : l’évaluation clinique au cours du suivi du patient

58e Congrès Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale (2023), Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale, Oct 2023, Toulouse, France

Accès: https://hal.science/hal-04230870

Jérôme Farinas, Corine Astesano, Robin Vaysse

Caractérisation automatique du rythme de la parole

Journée scientifique de Toulouse Mind and Brain Institute (TMBI 2023), Toulouse Mind and Brain Institute, May 2023, Toulouse, France

Accès: https://hal.science/hal-04096036

Vincent Roger, Jérôme Farinas, Virginie Woisard, Julien Pinquier

Création d’une mesure entropique de la parole pour évaluer l’intelligibilité de patients atteints de cancers des voies aérodigestives supérieures

34èmes Journées d’Études sur la Parole (JEP 2022), Association Française de la Communication Parlée, Jun 2022, Ile de Noirmoutier, France. pp.117-125, ⟨10.21437/JEP.2022-13⟩

Accès: https://hal.science/hal-03739691

Robin Vaysse, Alain Ghio, Corine Astésano, Jérôme Farinas, François Viallet

Analyse macroscopique des variations et modulations de F0 en lecture dans la maladie de Parkinson : données sur 320 locuteurs

34èmes Journées d’Études sur la Parole (JEP 2022), Association Française de la Communication Parlée, Jun 2022, Noirmoutier, France. pp.307–315, ⟨10.21437/JEP.2022-33⟩

Accès: https://hal.science/hal-03726999v2

Jérôme Farinas

Evaluation automatique de l’intelligibilité pour des patients présentant une atteinte de la voix

Premier webinaire de Start in Lab Santé 2021, Digital 113, Nov 2021, Toulouse, France

Accès: https://hal.science/hal-03464163

Mathieu Balaguer, Lucile Gelin, Virginie Woisard, Jérôme Farinas, Julien Pinquier

Mesure de l’intelligibilité après cancer oral ou oropharyngé par un système de reconnaissance automatique de la parole

1ère Journée Scientifique d’Orthophonie, SURO Société Universitaire de Recherche en Orthophonie, Oct 2021, Congrès en ligne, France

Accès: https://ut3-toulouseinp.hal.science/hal-03412659

Alain Ghio, Jérôme Farinas

La laryngophoniatrie du futur

Congrès National de la Société Française d’ORL, 2021, Paris, France

Accès: https://hal.science/hal-03365266v3

Books

Etienne Sicard, Anne Menin-Sicard, Marie Daumet, Stéphanie Perriere, Océane Barbera

Evaluation de la voix avant/après suivi orthophonique -à propos de la méthodologie d’évaluation et de la fiabilité des mesures chiffrées

Ortho Editions. Efficacité des thérapies, Ortho Editions, pp.233-264, 2017, 978-2-36235-100-6

Accès: https://hal.science/hal-02424850

Alexandre Boyer, Etienne Sicard

Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC

Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1

Accès: https://hal.science/hal-01951651

Books parts

Marie Garnier
Automatic correction of adverb placement errors for CALL
In : Eurocall12. G Lund (Eds.) , EUROCALL Association, (electronic medium), July 2012.
BibTeX
Hervé Bredin, Aurélien Mayoue, Gérard Chollet
Talking-Face Verification
In : Guide to Biometric Reference Systems and Performance Evaluation. Dijana Petrovska, Gérard Chollet, Bernadette Dorizzi (Eds.) , Springer, 10, pp. 297-326, 2009.
BibTeX
Brice Burger, Isabelle Ferrané, Frédéric Lerasle
Towards multimodal interface for interactive robots: challenges and robotic systems description
In : Cutting Edge Robotics 2009. Kordic Vedran (Eds.) , INTECH, (on line), August 2009.
URL : http://intechweb.org/invitations.php?code=4b5cb9fc911b854ff9bd08e5a7ad866f&PHPSESSID=7d013daoo3i48pshqjg610amf7
BibTeX
Khalid Daoudi
Iterated Function Systems and some generalizations: Local Regularity Analysis and Multifractal Modeling of Signals
In : Scaling Laws, Fractals and Wavelets. Patrice Abry, Paulo Gonçalves, Jacques Lévy Véhel (Eds.) , ISTE – WILEY, pp. 301-332, January 2009.
BibTeX
Gérard Chollet, Rémi Landais, Thomas Hueber, Hervé Bredin, Chafic Mokbel, Patrick Perrot, Leila Zouari
Some Experiments in Audio-Visual Speech Processing
In : Advances in Nonlinear Speech Processing. Mohamed Chetouani (Eds.) , Springer-Verlag, pp. 28-56, Vol. 4885/2007, LNCS, 2007.
BibTeX
Bouchra Abboud, Hervé Bredin, Guido Aversano , Gérard Chollet
Audio-visual Identity Verification: An Introductory Overview
In : Progress in Nonlinear Speech Processing. Yannis Stylianou, Marcos Faundez-Zanuy, Anna Eposito (Eds.) , Springer-Verlag, pp. 118-134, Vol. 4391/2007, LNCS, 2007.
BibTeX
Philippe Joly
Descriptions des séquences d’images
In : L’indexation multimédia Description et recherche automatiques. P. Gros (Eds.) , Hermès, pp. 119-136, Traité IC2, série Traitement du signal et de l’image, May 2007.
BibTeX
Jorge Gutierrez, Jean-Luc Rouas, Régine André-Obrecht
Application of uncertainty-based methods to fuse language identification expert decision
In : Modern Information Processing: From Theory to Application (Selected Papers of the IPMU’2004). B. Bouchon-Meunier, G. Coletti, R.R. Yager (Eds.) , Elsevier, pp. 255-268, 2006.
BibTeX
Farah Benamara, Véronique Moriceau
Prepositions in Cooperative Question-Answering Systems: a Preliminary Analysis
In : Syntax and semantics of prepositions. Patrick Saint-Dizier (Eds.) , Springer, pp. 307-330, Vol. 29, Text, Speech and Language Technology, November 2006.
URL : http://www.springerlink.com/content/978-1-4020-3873-0
BibTeX
Philippe Joly
Enjeux d’une normalisation pour l’indexation des contenus multimédia
In : Paradigmes et enjeux de l’informatique. N Bidoit, L Fariñas del Cerro, S Fdida, B Vallée (Eds.) , Hermès Science, pp. 157-169, Informatique et Systèmes d’Information, February 2005.
BibTeX

Thesis and HDR

Jérôme Farinas

La parole : du traitement automatique à la mesure de l’intelligibilité

Intelligence artificielle [cs.AI]. Université Paul Sabatier (Toulouse 3), 2023

Accès: https://hal.science/tel-04381096

Benjamin Chamand

Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30104⟩

Accès: https://theses.hal.science/tel-04229622

Robin Vaysse

Caractérisation automatique du rythme de la parole : application aux cancers des voies aéro-digestives supérieures et à la maladie de Parkinson

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30062⟩

Accès: https://theses.hal.science/tel-04198849

Sebastião Quintas

Deep learning approaches to assess speech intelligibility of head and neck cancer

Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30272⟩

Accès: https://theses.hal.science/tel-04094765

Estelle Randria

Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?

Informatique [cs]. Université Paul Sabatier (Toulouse 3), 2022. Français. ⟨NNT : 2022TOU30258⟩

Accès: https://theses.hal.science/tel-04064038

Vincent Roger

Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond : d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique

Apprentissage [cs.LG]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30180⟩

Accès: https://theses.hal.science/tel-03935738

Lucile Gelin

Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes

Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30031⟩

Accès: https://theses.hal.science/tel-03715653

Léo Cances

Apprentissage profond faiblement supervisé et semi-supervisé pour la détection d’évènements sonores

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30262⟩

Accès: https://theses.hal.science/tel-03683219

Timothy Pommée

Les mesures d’intelligibilité : état de l’art, considérations pratiques pour l’applicabilité clinique et explorations acoustiques

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30141⟩

Accès: https://theses.hal.science/tel-04136563

Mathieu Balaguer

Mesure de l’altération de la communication par analyses automatiques de la parole spontanée après traitement d’un cancer oral ou oropharyngé

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30109⟩

Accès: https://theses.hal.science/tel-03557511

Reports

Etienne Sicard, Anne Menin-Sicard

La diadococinésie et son application en orthophonique clinique

[Rapport de recherche] INSA 2020, INSA : Institut National des Sciences Appliquées de Toulouse. 2020

Accès: https://hal.science/hal-02512856

Etienne Sicard, Anne Menin-Sicard

Analyse de la qualité des phrases pour un bilan objectif de la parole

[Rapport de recherche] INSA Toulouse. 2019

Accès: https://hal.science/hal-02389764v2

Maëlys Salingre, Jérôme Farinas, Stéphane Rabant

Automatic identification of French regional accent

[Rapport de recherche] IRIT. 2017

Accès: https://hal.science/hal-03120304

Thomas Pellegrini, Céline Manenti, Julien Pinquier

The IRIT-UPS system @ ZeroSpeech 2017

[Research Report] IRIT. 2017

Accès: https://hal.science/hal-03131886

Reports

Archange Giscard Destiné
Recherche des expressions clés caractéristiques de linteraction entre locuteurs dans les documents audiovisuels
Master’s report, Université Paul Sabatier, June 2011.
Abstract URL : http://www.irit.fr/publis/SAMOVA/M2R/Memoire_M2R_ArchangeDestine.pdf
BibTeX
Noureddine Besbes
Indexation en intervenant d’un document vidéo par identification du visage
Master’s report, Université Paul Sabatier, June 2007.
URL : http://www.irit.fr/publis/SAMOVA/Memoire_M2R_Noureddine.pdf
BibTeX
Ihab Mallak
Description de comportements humains et interrogation.
Master’s report, Université de Toulouse, June 2006.
URL : http://www.phdgroup.org/ul-stsi-2005-2006.php
BibTeX
Hélène Lachambre
Caractérisation de la voix chantée
Master’s report, Institut National Polytechnique de Toulouse, June 2006.
BibTeX
Ali Mcheik
Application des matrices de similarité à la comparaison de contenus sonores
Master’s report, Université Paul Sabatier, June 2006.
BibTeX
Elie El Khoury
Segmentation et regroupement en locuteurs d’un document sonore
Master’s report, Université Paul Sabatier, June 2006.
BibTeX
Jeremy Philippeau
Caractérisation d’un intervenant dans un document audiovisuel
Internship report, Master Recherche 2IH, Université Paul Sabatier, June 2005.
BibTeX
Loïc Lefloch
Etude constractive de décodeurs acoustico-phonétique
Internship report, Master Recherche 2IH, Université Paul Sabatier, June 2005.
BibTeX
Christine Senac
Contribution à l’indexation multimedia
Research report, IRIT/2005-8-R, IRIT, March 2005.
BibTeX
José Anibal Arias
Méthodes à vecteurs de support et indexation sonore
Internship report, DEA IIL, Université Paul Sabatier, 2004.
BibTeX

Acronyme	Titre	Resp. sc	Début – fin
PhLEs-NID	Dispositif non invasif evaluant l’éfficacité pharyngo-laryngée	Jérôme FARINAS	2022 – 2026
ALAIA [Contract completed]	Apprentissage des Langues Assisté par Intelligence Artificielle	Isabelle FERRANÉ	2019 – 2023
LUDAU [Contract completed]	Découverte peu et non-supervisée d’unités audio à l’aide d’apprentissage profond	Thomas PELLEGRINI	2018 – 2023
RUGBI [Contract completed]	Recherche d’unités linguistiques pertinentes pour améliorer la mesure de l’intelligibilité de la parole altérée par des troubles de production pathologique	Jérôme FARINAS	2018 – 2023
RIDDLE [Contract completed]	Robots perceptuels et interactifs dédiés aux environnement quotidiens	Isabelle FERRANÉ	2012 – 2015

Acronyme	Titre	Resp. sc	Début – fin
VOICE4PD – MSA	Diagnostic différentiel entre la maladie de Parkinson et latrophie multisystématisée par analyse numérique de la parole	Julie MAUCLAIR	2016 – 2024
AudioToolBox [Contract completed]	Prestation TTT : AudioToolBox	Julien PINQUIER	2017 – 2018
ECREME [Contract completed]	Allocation Doctorale : Expertises Musicale et Cognitive pour Recommandation Musicale personnaliséE	Julien PINQUIER	2017 – 2020
TAPAS [Contract completed]	Training Network on Automatic Processing of PAthological Speech	Julie MAUCLAIR	2017 – 2022
VICTORIA [Contract completed]	Video analysis for Investigation of Criminal and TerrORIst Activities	Philippe JOLY	2017 – 2020
CIESS [Contract completed]	Contribution, indexation, et enrichissement d’un corpus de sons de l’environnement	Régine ANDRÉ-OBRECHT	2013 – 2016
DIADEMS [Contract completed]	Description, Indexation, Accés aux Documents Ethnomusicologiques et Sonores	Régine ANDRÉ-OBRECHT	2013 – 2016

Acronyme	Titre	Resp. sc	Début – fin
AUDIOCAP [Contract completed]	Audition et handicap dans le bruit vers la restauration de lintelligibilité de la parole	Julien PINQUIER	2019 – 2022
EVOLEX2 [Contract completed]	Apport de la reconnaissance vocale pour le diagnostic de dysfonctionnements cognitifs légers	Julien PINQUIER	2019 – 2021
INGPRO [Contract completed]	Recherche et Sociétés : Incidence des gestes sur la prononciation	Isabelle FERRANÉ	2019 – 2021
SAMI [Contract completed]	Allocation Doctorale : Système automatisé de mesure de lintelligibilité	Julien PINQUIER	2018 – 2021
Mesure de compréhenion de la parole [Contract completed]	Mesure de compréhension de la parole : équipement électronique intelligent de mesure de la compréhension de la parole basée sur une approche cognitive sur l’exemple de la compréhension humaine	Jérôme FARINAS	2012 – 2015

Monday 8 July 2024 – Friday 12 July 2024

Conférence francophone JEP-TALN-RECITAL 2024

UT2 Jean Jaurès

#congres Know more

Wednesday 3 April 2024, 9h00

Description automatique des événements sonores par des méthodes d’apprentissage profond – CoNeTTE, un système d’Audio Captioning générique

Etienne LABBÉ – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Friday 15 March 2024, 9h00

Dilated Convolution with Learnable Spacings (DCLS)

Ismail KHALFAOUI HASSANI – Team SAMOVA, IRIT Centre de Recherche Cerveau et Cognition (CerCo), Toulouse

#these

Monday 11 March 2024, 14h00

Caractérisation et mesure de la compréhensibilité de la parole de locuteurs non natifs dans le cadre de l’apprentissage des langues

Verdiana DE FINO – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Tuesday 16 May 2023, 10h00

Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons

Benjamin CHAMAND – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Tuesday 21 March 2023, 9h00

Automatic characterisation of speech rhythm: application to Head and Neck cancers and Parkinson’s disease

Robin VAYSSE – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Wednesday 30 November 2022, 14h00

Deep Learning Approaches to Assess Speech Intelligibility of Head and Neck Cancers

Sebastiao QUINTAS – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Monday 17 October 2022, 14h00

Comprehensibility of audiovisual contents: which approaches for an objective measurement?

Estelle RANDRIA – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Thursday 29 September 2022, 14h00

Modeling the severity index of speech impairment using deep learning methods A modeling from few examples to an entropic measure via self-supervised learning

Vincent ROGER – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Wednesday 2 February 2022, 14h00

Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes

Lucile GELIN – Team SAMOVA, IRIT UT3 Paul Sabatier, IMT, Bât 1R3, Amphi. Schwartz

#these

Tuesday 14 December 2021, 14h00

Apprentissage profond faiblement et semi-supervisé pour la détection d’évènements sonores

Leo CANCES – Team SAMOVA, IRIT UT3 Paul Sabatier, IMT, Bât 1R3, Amphi. Schwartz

#these

Monday 8 July 2024 – Friday 12 July 2024

Conférence francophone JEP-TALN-RECITAL 2024

UT2 Jean Jaurès

#congres Know more

Thursday 9 January 2020 – Friday 10 January 2020

12th Speech In Noise Workshop

Hôtel-Dieu Saint-Jacques, Toulouse

#congres Know more

Monday 4 July 2016 – Friday 8 July 2016

Journées d’Etudes sur la Parole

INALCO, 75013 Paris

#congres Know more

Thursday 21 February 2019, 11h00 – 12h00

Weakly-supervised approaches for sound event detection

Thomas PELLEGRINI – Team SAMOVA – IRIT (France) INP-ENSEEIHT, Salle des thèses

#seminaire

Wednesday 31 August 2016, 10h00 – 12h00

Advanced human robot social interaction: goals, challenges and approaches

Sarah COSENTINO – Waseda University (Japon) UT3 Paul Sabatier, IRIT, Salle des Thèses

#seminaire

Monday 20 April 2015, 13h30

Analyse de signaux multi-composantes: avancées théoriques et applications musicales

Dominique FOURER UT3 Paul Sabatier, IRIT, Salle des Thèses

#seminaire

Thursday 21 December 2023, 10h00

La parole : du traitement automatique à la mesure de l’intelligibilité

Jérôme FARINAS – Team SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#hdr

Monday 19 May 2014, 15h00

Segmentations sonore et audiovisuelle ?

Julien PINQUIER – Team SAMOVA – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#hdr

Thursday 15 June 2023 – Saturday 17 June 2023

9es Journées de Phonétique Clinique (JPC2023)

UT2 Jean Jaurès, Maison de la Recherche

#journee

Thursday 27 May 2021

Séminaire AFCP — Phonétique Clinique (en remplacement de JPC2021)

UT3 Paul Sabatier, En visioconférence

#journee

Wednesday 4 September 2019 – Friday 6 September 2019

Training Network on Automatic Processing of PAthological Speech (TAPAS) TE3: Data Collection, Management and Ethical Practices

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

Thursday 4 October 2018

2018 AIRBUS Air Traffic Control Challenge Workshop

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

Thursday 8 March 2018

Traitement automatique de la parole et ressources pour la didactique de l’oral en L2 : variation, corpus, techniques

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

Wednesday 4 October 2017

Workshop Language Didactics, Gestures & CALL

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

SAMOVA Team

skills

team Members

team publications

team Contracts