Équipe SAMOVA

Responsable : Julien PINQUIER

Membres permanents

Régine ANDRÉ-OBRECHTProfesseur Emérite (HDR) – UT3
Hervé BREDINChargé de Recherche – CNRS
Jérôme FARINASMaître de Conférences (HDR) – UT3
Isabelle FERRANÉMaître de Conférences – UT3
Philippe JOLYProfesseur – UT3
Julie MAUCLAIRMaître de Conférences – UT3
Thomas PELLEGRINIMaître de Conférences – UT3
Julien PINQUIERMaître de Conférences (HDR) – UT3
Christine SENACMaître de Conférences – UT3

Membres non – permanents

Philippe ALLETDoctorant – UT3
Elie BANIDEStagiaire M2 – Université Paris Est Créteil
Anaïs BOULZEStagiaire M1 – UT3
Romain CONTRAINIngénieur de Recherche – UT3
Lila GRAVELLIERDoctorant – UT3
Gayane KHARATYANStagiaire M1 – UT3
Adrien LAFOREDoctorant – UT3 (co-encadrement MELODI)
Martin LEBOURDAISChercheur Contractuel – CNRS
Maelys LEIÇARRAGUEStagiaire L – UT3
Clément PAGESIngénieur d’Etudes – CNRS
Jim PETIOTIngénieur d’Etudes – UT3
Alexis PLAQUETDoctorant – UT3
Sebastiao QUINTASChercheur Contractuel – ANITI
Ludovic TUNCAYDoctorant – UT3

Membres extérieur

Mathieu BALAGUERIngénieur de Recherche Associé – UT3
Lucile GELINChercheur Associé – Lalilo
Etienne LABBÉJeune docteur IRIT – UT3

Articles dans des revues internationales

Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

Automatic modelling of perceptual judges in the context of head and neck cancer speech intelligibility

International Journal of Language and Communication Disorders, 2024, pp.1–14. ⟨10.1111/1460-6984.13004⟩

Accès: https://hal.science/hal-04405083

Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

Development of a holistic communication score (HoCoS) in patients treated for oral or oropharyngeal cancer: Preliminary validation

International Journal of Language and Communication Disorders, 2023, 58 (1), pp.39-51. ⟨10.1111/1460-6984.12766⟩

Accès: https://hal.science/hal-03765649v2

Lionel Pibre, Jorge Francisco Madrigal Diaz, Cyrille Equoy, Frédéric Lerasle, Thomas Pellegrini, Julien Pinquier, Isabelle Ferrané

Audio-video fusion strategies for active speaker detection in meetings

Multimedia Tools and Applications, 2022, 2022, pp.1-26. ⟨10.1007/s11042-022-13746-7⟩

Accès: https://hal.science/hal-03792965

Léo Cances, Etienne Labbé, Thomas Pellegrini

Comparison of Semi-supervised Deep Learning Algorithms for Audio Classification

EURASIP Journal on Audio, Speech, and Music Processing, 2022, 2022 (1, article 23), pp.1-14. ⟨10.1186/s13636-022-00255-6⟩

Accès: https://hal.science/hal-03855042

Vincent Roger, Jérôme Farinas, Julien Pinquier

Deep neural networks for automatic speech processing: a survey from large corpora to limited data

EURASIP Journal on Audio, Speech, and Music Processing, 2022, article 19, pp.1-15. ⟨10.1186/s13636-022-00251-w⟩

Accès: https://hal.science/hal-03755976

Mathieu Balaguer, Timothy Pommée, Julien Pinquier, Jérôme Farinas, Virginie Woisard, Florence Sordes

Development and preliminary validation of the questionnaire ‘Evaluation of the constitution of social circles (ECSC)’ in patients treated for cancer of the upper aerodigestive tract

Folia Phoniatrica et Logopaedica, 2022, 75 (1), pp.52-66. ⟨10.1159/000525352⟩

Accès: https://hal.science/hal-03716864

Lionel Fontan, Libio Gonçalves Braz, Julien Pinquier, Michael Stone, Christian Füllgrabe

Using Automatic Speech Recognition to Optimize Hearing-Aid Time Constants

Frontiers in Neuroscience, 2022, 16 (779062), ⟨10.3389/fnins.2022.779062⟩

Accès: https://hal.science/hal-03627441

Libio Gonçalves Braz, Lionel Fontan, Julien Pinquier, Michael A Stone, Christian Füllgrabe

OPRA-RS: A Hearing-Aid Fitting Method Based on Automatic Speech Recognition and Random Search

Frontiers in Neuroscience, 2022, 16, pp.779048. ⟨10.3389/fnins.2022.779048⟩

Accès: https://ut3-toulouseinp.hal.science/hal-03582025

Renée Speyer, Anna-Liisa Sutt, Liza Bergström, Shaheen Hamdy, Timothy Pommée, Mathieu Balaguer, Anett Kaale, Reinie Cordier

Neurostimulation in People with Oropharyngeal Dysphagia

Journal of Clinical Medicine, 2022, Special issue : Advances in Management of Voice and Swallowing Disorders, 11 (4), pp.993. ⟨10.3390/jcm11040993⟩

Accès: https://ut3-toulouseinp.hal.science/hal-03581586

Chems-Eddine Himeur, Thibault Lejemble, Thomas Pellegrini, Mathias Paulin, Loic Barthe, Nicolas Mellado

PCEDNet : A Lightweight Neural Network for Fast and Interactive Edge Detection in 3D Point Clouds

ACM Transactions on Graphics, 2022, 41 (1), pp.1-21. ⟨10.1145/3481804⟩

Accès: https://hal.science/hal-03349971

Articles dans des revues nationales

Mathieu Balaguer, Timothy Pommée, Jérôme Farinas, Julien Pinquier, Virginie Woisard

Paramètres perceptifs expliquant la sévérité du trouble de parole mesurée automatiquement en cancérologie ORL

Rééducation orthophonique, 2021, Chapitre : “De l’exploration à la prise en soins de la voix chez l’adulte : données actuelles.. sur la voie des voix”, 286, pp.1-13

Accès: https://ut3-toulouseinp.hal.science/hal-03277422

Mathieu Balaguer, Josiane Percodani, Virginie Woisard

Le Carcinologic Handicap Index (CHI) : questionnaire d’autoévaluation du handicap à destination des patients traités pour cancer des VADS

Annales françaises d’Oto-rhino-laryngologie et de Pathologie Cervico-faciale, 2017, 134 (6), pp.382-387. ⟨10.1016/j.aforl.2016.07.021⟩

Accès: https://hal.science/hal-02553232

Articles dans des revues nationales

Sylvain Detey, Lionel Fontan, Thomas Pellegrini
Traitement de la prononciation en langue étrangère : approches didactiques, méthodes automatiques et enjeux pour l’apprentissage
Dans : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 57, N. 3, (en ligne), 2016.
Accès : https://www.atala.org/Traitement-de-la-prononciation-en – https://oatao.univ-toulouse.fr/19173/
BibTeX
Lionel Fontan, Cynthia Magnen, Julien Tardieu, Isabelle Ferrané, Julien Pinquier, Jérôme Farinas, Pascal Gaillard, Xavier Aumont
Comparaison de mesures perceptives et automatiques de l’intelligibilité : application à de la parole simulant la presbyacousie
Dans : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 55, N. 2, p. 151-174, mars 2015.
Résumé Accès : http://www.atala.org/Comparaison-de-mesures-perceptives – https://oatao.univ-toulouse.fr/15274/
BibTeX
Blandine Boudet, Thérèse Giacobini, Isabelle Ferrané, Carine Fortin, Christophe Mollaret, Frédéric Lerasle, Pierre Rumeau
Quels sont les objets égarés à domicile par les personnes âgées fragiles ? Une étude pilote sur 60 personnes.
Dans : Neurologie – Psychiatrie – Gériatrie (NPG), Elsevier, Vol. Vol. 14/79, p. 38-42, 2014.
Accès : https://oatao.univ-toulouse.fr/13000/
BibTeX
David Janiszek, Damien Pellier, Julie Mauclair, Laetitia Boulc’H, Jean-Louis Baron, Yannick Parchemal
Utilisation de la robotique pédagogique pour enseigner l’intelligence artificielle : une expérience d’approche par projet auprès d’étudiants en informatique.
Dans : Sciences et Technologies de l’Information et de la Communication pour l’Éducation et la Formation (STICEF), Association des Technologies de l’Information pour l’Education et la Formation, Paris, Vol. 18, (en ligne), 2011.
Accès : http://sticef.univ-lemans.fr/num/vol2011/07r-janiszek/sticef_2011_janiszek_07rp.html
BibTeX
Jérôme Farinas, Jean-Luc Rouas, François Pellegrino, Régine André-Obrecht
Extraction automatique de paramètres prosodiques pour l’identification automatique des langues
Dans : Traitement du Signal, GRETSI : Groupement de Recherche en Traitement du Signal et des Images, Vol. 22, N. 2, p. 81-97, 2005.
Accès : http://documents.irevues.inist.fr/bitstream/handle/2042/2443/02%22Andr%E9-Obrecht+couleur.pdf?sequence=1
BibTeX
Julien Pinquier, Jean-Luc Rouas, Régine André-Obrecht
Fusion de paramètres pour une classification automatique parole/musique robuste
Dans : Technique et science informatiques (TSI) : Fusion numérique/symbolique, Hermès, 8, quai du marche neuf, F-75004 Paris, Vol. 22, p. 831-852, 2003.
BibTeX
Régine André-Obrecht, Abdelouafi Meziane, Bruno Jacob
Modélisation de la durée des sons dans un système de reconnaissance automatique de la parole
Dans : Comptes Rendus de l’Académie des Sciences, Académie des Sciences, Elsevier, Paris, Vol. t327 série IIb, p. 379-382, 1999.
BibTeX

Rédaction de numéros spéciaux de revues

Philippe Ercolessi, Christine Senac, Hervé Bredin, Sandrine Mouysset
Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d’histoires
Dans : Revue des Sciences et Technologies de l’Information, Hermès Science, Vol. 15 N. 2, pp. 41-66, 2012.
Accès : http://www.irit.fr/publis/SAMOVA/
BibTeX
Ebroul Iquierdo, Jenny Bennois-Pineau, Régine André-Obrecht
Special Issue on Content Based Multimedia Indexing and Retrieval
Dans : Signal Processing: Image Communication, Elsevier, Vol. 22, Issues 7-8, 2007.
BibTeX
Régine André-Obrecht
Special Issue on Speaker Recognition and its Commercial and Forensic Applications
Dans : International Journal Speech Communication, N.H Elsevier ISSN 0167-6393, North Holland, Vol. 31, Nos 2-3, juin 2000.
BibTeX
Philippe Joly, Hae-Kwang Kim
Efficient Automatic Analysis of Camera Work and Microsegmentation of Video Using Spatio-Temporal Images
Dans : Signal Processing : Image Communication, Elsevier, Eurasip, Amsterdam, Vol. 8(4), mai 1996.
BibTeX

Conférences et workshops internationaux avec actes édités et comité de lecture

Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

Can we use speaker embeddings on spontaneous speech obtained from medical conversations to predict intelligibility?

IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2023), IEEE, Dec 2023, Taipei, Taiwan. à paraître

Accès: https://hal.science/hal-04230836

Marvin Lavechin, Marianne Métais, Hadrien Titeux, Alodie Boissonnet, Jade Copet, Morgane Rivière, Elika Bergelson, Alejandrina Cristia, Emmanuel Dupoux, Hervé Bredin

Brouhaha: multi-task training for voice activity detection, speech-to-noise ratio, and C50 room acoustics estimation

IEEE Automatic Speech Recognition and Understanding (ASRU 2023 ), IEEE, Dec 2023, Taipei, Taiwan. pp.1–7

Accès: https://hal.science/hal-04247647

Ismail Khalfaoui-Hassani, Timothée Masquelier, Thomas Pellegrini

Audio classification with Dilated Convolution with Learnable Spacings

NeurIPS 2023 – Workshop on Machine Learning for Audio, Dec 2023, New Orleans, United States

Accès: https://inria.hal.science/hal-04314269

Verdiana De Fino

Automatic assessment of L2 speech from proficiency to comprehensibility: illustration among Japanese learners of French

Speech assessment and native and non-native linguistic variation (2023), Oct 2023, Tokyo (JP), Japan

Accès: https://hal.science/hal-04329222

Etienne Labbé, Thomas Pellegrini, Julien Pinquier

Killing two birds with one stone: can an audio captioning system also be used for audio-test retrieval?

8th workshop on Detection and Classification of Acoustic Scenes and Events (DCASE2023), Sep 2023, Tampere, Finland

Accès: https://hal.science/hal-04180972

Etienne Labbé, Julien Pinquier, Thomas Pellegrini

Multitask learning in Audio Captioning: a sentence embedding regression loss acts as a regularizer

31st European Signal Processing Conference (EUSIPCO 2023), Sep 2023, Helsinki, Finland. ⟨10.48550/arXiv.2305.01482⟩

Accès: https://hal.science/hal-04207519

Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier

Détection automatique de la déglutition dans les signaux d’auscultation cervicale à haute résolution

XXIXème Colloque Francophone de Traitement du Signal et des Images (GRETSI 2023), Association GRETSI : Groupe de recherche et d’études du traitement du signal et des images, Aug 2023, Grenoble, France. pp.1–4

Accès: https://hal.science/hal-04555536

Marvin Lavechin, Yaya Sy, Hadrien Titeux, María Andrea Cruz Blandón, Okko Räsänen, Hervé Bredin, Emmanuel Dupoux, Alejandrina Cristia

BabySLM: language-acquisition-friendly benchmark of self-supervised spoken language models

INTERSPEECH 2023, Aug 2023, Dublin, Ireland. pp.4588-4592, ⟨10.21437/Interspeech.2023-978⟩

Accès: https://hal.science/hal-04247612

Alexis Plaquet, Hervé Bredin

Powerset multi-class cross entropy loss for neural speaker diarization

24th INTERSPEECH Conference (INTERSPEECH 2023), Aug 2023, Dublin, Ireland. pp.3222-3226, ⟨10.21437/Interspeech.2023-205⟩

Accès: https://hal.science/hal-04233796

Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

Development of a holistic communication score (HoCoS) in patients treated for oral or oropharyngeal cancer: preliminary validation

32nd World Congress of the IALP (2023), IALP: International Association of Communication Sciences and Disorders, Aug 2023, Auckland, New Zealand

Accès: https://hal.science/hal-04221418

Conférences et workshops nationaux avec actes édités et comité de lecture

Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané

Détection et classification automatiques d’erreurs de prononciation en L2 : approche basée sur les connaissances didactiques

Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France

Accès: https://hal.science/hal-04331354

Verdiana De Fino, Isabelle Ferrané, Lionel Fontan, Julien Pinquier

Prédiction de la compréhensibilité de la parole d’apprenants de français

Accès: https://hal.science/hal-04329163

Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

Mesure du trouble de parole dans le suivi cancérologique grâce à la reconnaissance automatique de la parole

55e Congrès de la Société Française de Chirurgie Cervico-Faciale (SFCCF 2023), Université de Nantes; Société Française de Chirurgie Cervico-Faciale, Nov 2023, Nantes, France

Accès: https://hal.science/hal-04297963

Mathieu Balaguer

Parole et communication après cancer oral ou oropharyngé : l’évaluation clinique au cours du suivi du patient

58e Congrès Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale (2023), Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale, Oct 2023, Toulouse, France

Accès: https://hal.science/hal-04230870

Jérôme Farinas, Corine Astesano, Robin Vaysse

Caractérisation automatique du rythme de la parole

Journée scientifique de Toulouse Mind and Brain Institute (TMBI 2023), Toulouse Mind and Brain Institute, May 2023, Toulouse, France

Accès: https://hal.science/hal-04096036

Vincent Roger, Jérôme Farinas, Virginie Woisard, Julien Pinquier

Création d’une mesure entropique de la parole pour évaluer l’intelligibilité de patients atteints de cancers des voies aérodigestives supérieures

34èmes Journées d’Études sur la Parole (JEP 2022), Association Française de la Communication Parlée, Jun 2022, Ile de Noirmoutier, France. pp.117-125, ⟨10.21437/JEP.2022-13⟩

Accès: https://hal.science/hal-03739691

Robin Vaysse, Alain Ghio, Corine Astésano, Jérôme Farinas, François Viallet

Analyse macroscopique des variations et modulations de F0 en lecture dans la maladie de Parkinson : données sur 320 locuteurs

34èmes Journées d’Études sur la Parole (JEP 2022), Association Française de la Communication Parlée, Jun 2022, Noirmoutier, France. pp.307–315, ⟨10.21437/JEP.2022-33⟩

Accès: https://hal.science/hal-03726999v2

Jérôme Farinas

Evaluation automatique de l’intelligibilité pour des patients présentant une atteinte de la voix

Premier webinaire de Start in Lab Santé 2021, Digital 113, Nov 2021, Toulouse, France

Accès: https://hal.science/hal-03464163

Mathieu Balaguer, Lucile Gelin, Virginie Woisard, Jérôme Farinas, Julien Pinquier

Mesure de l’intelligibilité après cancer oral ou oropharyngé par un système de reconnaissance automatique de la parole

1ère Journée Scientifique d’Orthophonie, SURO Société Universitaire de Recherche en Orthophonie, Oct 2021, Congrès en ligne, France

Accès: https://ut3-toulouseinp.hal.science/hal-03412659

Alain Ghio, Jérôme Farinas

La laryngophoniatrie du futur

Congrès National de la Société Française d’ORL, 2021, Paris, France

Accès: https://hal.science/hal-03365266v3

Livres (monographies)

Etienne Sicard, Anne Menin-Sicard, Marie Daumet, Stéphanie Perriere, Océane Barbera

Evaluation de la voix avant/après suivi orthophonique -à propos de la méthodologie d’évaluation et de la fiabilité des mesures chiffrées

Ortho Editions. Efficacité des thérapies, Ortho Editions, pp.233-264, 2017, 978-2-36235-100-6

Accès: https://hal.science/hal-02424850

Alexandre Boyer, Etienne Sicard

Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC

Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1

Accès: https://hal.science/hal-01951651

Contributions à des ouvrages de synthèse

Marie Garnier
Automatic correction of adverb placement errors for CALL
Dans : Eurocall12. G Lund (Eds.) , EUROCALL Association, (support électronique), juillet 2012.
BibTeX
Hervé Bredin, Aurélien Mayoue, Gérard Chollet
Talking-Face Verification
Dans : Guide to Biometric Reference Systems and Performance Evaluation. Dijana Petrovska, Gérard Chollet, Bernadette Dorizzi (Eds.) , Springer, 10, p. 297-326, 2009.
BibTeX
Brice Burger, Isabelle Ferrané, Frédéric Lerasle
Towards multimodal interface for interactive robots: challenges and robotic systems description
Dans : Cutting Edge Robotics 2009. Kordic Vedran (Eds.) , INTECH, (en ligne), août 2009.
Accès : http://intechweb.org/invitations.php?code=4b5cb9fc911b854ff9bd08e5a7ad866f&PHPSESSID=7d013daoo3i48pshqjg610amf7
BibTeX
Khalid Daoudi
Iterated Function Systems and some generalizations: Local Regularity Analysis and Multifractal Modeling of Signals
Dans : Scaling Laws, Fractals and Wavelets. Patrice Abry, Paulo Gonçalves, Jacques Lévy Véhel (Eds.) , ISTE – WILEY, p. 301-332, janvier 2009.
BibTeX
Gérard Chollet, Rémi Landais, Thomas Hueber, Hervé Bredin, Chafic Mokbel, Patrick Perrot, Leila Zouari
Some Experiments in Audio-Visual Speech Processing
Dans : Advances in Nonlinear Speech Processing. Mohamed Chetouani (Eds.) , Springer-Verlag, p. 28-56, Vol. 4885/2007, LNCS, 2007.
BibTeX
Bouchra Abboud, Hervé Bredin, Guido Aversano , Gérard Chollet
Audio-visual Identity Verification: An Introductory Overview
Dans : Progress in Nonlinear Speech Processing. Yannis Stylianou, Marcos Faundez-Zanuy, Anna Eposito (Eds.) , Springer-Verlag, p. 118-134, Vol. 4391/2007, LNCS, 2007.
BibTeX
Philippe Joly
Descriptions des séquences d’images
Dans : L’indexation multimédia Description et recherche automatiques. P. Gros (Eds.) , Hermès, p. 119-136, Traité IC2, série Traitement du signal et de l’image, mai 2007.
BibTeX
Jorge Gutierrez, Jean-Luc Rouas, Régine André-Obrecht
Application of uncertainty-based methods to fuse language identification expert decision
Dans : Modern Information Processing: From Theory to Application (Selected Papers of the IPMU’2004). B. Bouchon-Meunier, G. Coletti, R.R. Yager (Eds.) , Elsevier, p. 255-268, 2006.
BibTeX
Farah Benamara, Véronique Moriceau
Prepositions in Cooperative Question-Answering Systems: a Preliminary Analysis
Dans : Syntax and semantics of prepositions. Patrick Saint-Dizier (Eds.) , Springer, p. 307-330, Vol. 29, Text, Speech and Language Technology, novembre 2006.
Accès : http://www.springerlink.com/content/978-1-4020-3873-0
BibTeX
Philippe Joly
Enjeux d’une normalisation pour l’indexation des contenus multimédia
Dans : Paradigmes et enjeux de l’informatique. N Bidoit, L Fariñas del Cerro, S Fdida, B Vallée (Eds.) , Hermès Science, p. 157-169, Informatique et Systèmes d’Information, février 2005.
BibTeX

Thèses et habilitations

Jérôme Farinas

La parole : du traitement automatique à la mesure de l’intelligibilité

Intelligence artificielle [cs.AI]. Université Paul Sabatier (Toulouse 3), 2023

Accès: https://hal.science/tel-04381096

Benjamin Chamand

Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30104⟩

Accès: https://theses.hal.science/tel-04229622

Robin Vaysse

Caractérisation automatique du rythme de la parole : application aux cancers des voies aéro-digestives supérieures et à la maladie de Parkinson

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30062⟩

Accès: https://theses.hal.science/tel-04198849

Sebastião Quintas

Deep learning approaches to assess speech intelligibility of head and neck cancer

Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30272⟩

Accès: https://theses.hal.science/tel-04094765

Estelle Randria

Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?

Informatique [cs]. Université Paul Sabatier (Toulouse 3), 2022. Français. ⟨NNT : 2022TOU30258⟩

Accès: https://theses.hal.science/tel-04064038

Vincent Roger

Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond : d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique

Apprentissage [cs.LG]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30180⟩

Accès: https://theses.hal.science/tel-03935738

Lucile Gelin

Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes

Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30031⟩

Accès: https://theses.hal.science/tel-03715653

Léo Cances

Apprentissage profond faiblement supervisé et semi-supervisé pour la détection d’évènements sonores

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30262⟩

Accès: https://theses.hal.science/tel-03683219

Timothy Pommée

Les mesures d’intelligibilité : état de l’art, considérations pratiques pour l’applicabilité clinique et explorations acoustiques

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30141⟩

Accès: https://theses.hal.science/tel-04136563

Mathieu Balaguer

Mesure de l’altération de la communication par analyses automatiques de la parole spontanée après traitement d’un cancer oral ou oropharyngé

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30109⟩

Accès: https://theses.hal.science/tel-03557511

Rapports

Etienne Sicard, Anne Menin-Sicard

La diadococinésie et son application en orthophonique clinique

[Rapport de recherche] INSA 2020, INSA : Institut National des Sciences Appliquées de Toulouse. 2020

Accès: https://hal.science/hal-02512856

Etienne Sicard, Anne Menin-Sicard

Analyse de la qualité des phrases pour un bilan objectif de la parole

[Rapport de recherche] INSA Toulouse. 2019

Accès: https://hal.science/hal-02389764v2

Maëlys Salingre, Jérôme Farinas, Stéphane Rabant

Automatic identification of French regional accent

[Rapport de recherche] IRIT. 2017

Accès: https://hal.science/hal-03120304

Thomas Pellegrini, Céline Manenti, Julien Pinquier

The IRIT-UPS system @ ZeroSpeech 2017

[Research Report] IRIT. 2017

Accès: https://hal.science/hal-03131886

Rapports

Archange Giscard Destiné
Recherche des expressions clés caractéristiques de linteraction entre locuteurs dans les documents audiovisuels
Rapport de Master, Université Paul Sabatier, juin 2011.
Résumé Accès : http://www.irit.fr/publis/SAMOVA/M2R/Memoire_M2R_ArchangeDestine.pdf
BibTeX
Noureddine Besbes
Indexation en intervenant d’un document vidéo par identification du visage
Rapport de Master, Université Paul Sabatier, juin 2007.
Accès : http://www.irit.fr/publis/SAMOVA/Memoire_M2R_Noureddine.pdf
BibTeX
Ihab Mallak
Description de comportements humains et interrogation.
Rapport de Master, Université de Toulouse, juin 2006.
Accès : http://www.phdgroup.org/ul-stsi-2005-2006.php
BibTeX
Hélène Lachambre
Caractérisation de la voix chantée
Rapport de Master, Institut National Polytechnique de Toulouse, juin 2006.
BibTeX
Ali Mcheik
Application des matrices de similarité à la comparaison de contenus sonores
Rapport de Master, Université Paul Sabatier, juin 2006.
BibTeX
Elie El Khoury
Segmentation et regroupement en locuteurs d’un document sonore
Rapport de Master, Université Paul Sabatier, juin 2006.
BibTeX
Jeremy Philippeau
Caractérisation d’un intervenant dans un document audiovisuel
Rapport de stage, Master Recherche 2IH, Université Paul Sabatier, juin 2005.
BibTeX
Loïc Lefloch
Etude constractive de décodeurs acoustico-phonétique
Rapport de stage, Master Recherche 2IH, Université Paul Sabatier, juin 2005.
BibTeX
Christine Senac
Contribution à l’indexation multimedia
Rapport de recherche, IRIT/2005-8-R, IRIT, mars 2005.
BibTeX
José Anibal Arias
Méthodes à vecteurs de support et indexation sonore
Rapport de stage, DEA IIL, Université Paul Sabatier, 2004.
BibTeX

Acronyme	Titre	Resp. sc	Début – fin
PhLEs-NID	Dispositif non invasif evaluant l’éfficacité pharyngo-laryngée	Jérôme FARINAS	2022 – 2026
ALAIA [Contrat terminé]	Apprentissage des Langues Assisté par Intelligence Artificielle	Isabelle FERRANÉ	2019 – 2023
LUDAU [Contrat terminé]	Découverte peu et non-supervisée d’unités audio à l’aide d’apprentissage profond	Thomas PELLEGRINI	2018 – 2023
RUGBI [Contrat terminé]	Recherche d’unités linguistiques pertinentes pour améliorer la mesure de l’intelligibilité de la parole altérée par des troubles de production pathologique	Jérôme FARINAS	2018 – 2023
RIDDLE [Contrat terminé]	Robots perceptuels et interactifs dédiés aux environnement quotidiens	Isabelle FERRANÉ	2012 – 2015

Acronyme	Titre	Resp. sc	Début – fin
VOICE4PD – MSA	Diagnostic différentiel entre la maladie de Parkinson et latrophie multisystématisée par analyse numérique de la parole	Julie MAUCLAIR	2016 – 2024
AudioToolBox [Contrat terminé]	Prestation TTT : AudioToolBox	Julien PINQUIER	2017 – 2018
ECREME [Contrat terminé]	Allocation Doctorale : Expertises Musicale et Cognitive pour Recommandation Musicale personnaliséE	Julien PINQUIER	2017 – 2020
TAPAS [Contrat terminé]	Training Network on Automatic Processing of PAthological Speech	Julie MAUCLAIR	2017 – 2022
VICTORIA [Contrat terminé]	Video analysis for Investigation of Criminal and TerrORIst Activities	Philippe JOLY	2017 – 2020
CIESS [Contrat terminé]	Contribution, indexation, et enrichissement d’un corpus de sons de l’environnement	Régine ANDRÉ-OBRECHT	2013 – 2016
DIADEMS [Contrat terminé]	Description, Indexation, Accés aux Documents Ethnomusicologiques et Sonores	Régine ANDRÉ-OBRECHT	2013 – 2016

Acronyme	Titre	Resp. sc	Début – fin
AUDIOCAP [Contrat terminé]	Audition et handicap dans le bruit vers la restauration de lintelligibilité de la parole	Julien PINQUIER	2019 – 2022
EVOLEX2 [Contrat terminé]	Apport de la reconnaissance vocale pour le diagnostic de dysfonctionnements cognitifs légers	Julien PINQUIER	2019 – 2021
INGPRO [Contrat terminé]	Recherche et Sociétés : Incidence des gestes sur la prononciation	Isabelle FERRANÉ	2019 – 2021
SAMI [Contrat terminé]	Allocation Doctorale : Système automatisé de mesure de lintelligibilité	Julien PINQUIER	2018 – 2021
Mesure de compréhenion de la parole [Contrat terminé]	Mesure de compréhension de la parole : équipement électronique intelligent de mesure de la compréhension de la parole basée sur une approche cognitive sur l’exemple de la compréhension humaine	Jérôme FARINAS	2012 – 2015

Lundi 8 Juillet 2024 – Vendredi 12 Juillet 2024

Conférence francophone JEP-TALN-RECITAL 2024

UT2 Jean Jaurès

#congres En savoir plus

Mercredi 3 Avril 2024, 9h00

Description automatique des événements sonores par des méthodes d’apprentissage profond – CoNeTTE, un système d’Audio Captioning générique

Etienne LABBÉ – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Vendredi 15 Mars 2024, 9h00

Convolution Dilatée avec Espacements Apprenables

Ismail KHALFAOUI HASSANI – Equipe SAMOVA, IRIT Centre de Recherche Cerveau et Cognition (CerCo), Toulouse

#these

Lundi 11 Mars 2024, 14h00

Caractérisation et mesure de la compréhensibilité de la parole de locuteurs non natifs dans le cadre de l’apprentissage des langues

Verdiana DE FINO – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Mardi 16 Mai 2023, 10h00

Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons

Benjamin CHAMAND – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Mardi 21 Mars 2023, 9h00

Caractérisation automatique du rythme de la parole : application aux cancers des voies aéro-digestives supérieures et à la maladie de Parkinson

Robin VAYSSE – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Mercredi 30 Novembre 2022, 14h00

Deep Learning Approaches to Assess Speech Intelligibility of Head and Neck Cancers

Sebastiao QUINTAS – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Lundi 17 Octobre 2022, 14h00

Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?

Estelle RANDRIA – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Jeudi 29 Septembre 2022, 14h00

Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique

Vincent ROGER – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#these

Mercredi 2 Février 2022, 14h00

Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes

Lucile GELIN – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IMT, Bât 1R3, Amphi. Schwartz

#these

Mardi 14 Décembre 2021, 14h00

Apprentissage profond faiblement et semi-supervisé pour la détection d’évènements sonores

Leo CANCES – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IMT, Bât 1R3, Amphi. Schwartz

#these

Lundi 8 Juillet 2024 – Vendredi 12 Juillet 2024

Conférence francophone JEP-TALN-RECITAL 2024

UT2 Jean Jaurès

#congres En savoir plus

Jeudi 9 Janvier 2020 – Vendredi 10 Janvier 2020

12th Speech In Noise Workshop

Hôtel-Dieu Saint-Jacques, Toulouse

#congres En savoir plus

Lundi 4 Juillet 2016 – Vendredi 8 Juillet 2016

Journées d’Etudes sur la Parole

INALCO, 75013 Paris

#congres En savoir plus

Jeudi 21 Février 2019, 11h00 – 12h00

Weakly-supervised approaches for sound event detection

Thomas PELLEGRINI – Equipe SAMOVA – IRIT (France) INP-ENSEEIHT, Salle des thèses

#seminaire

Mercredi 31 Août 2016, 10h00 – 12h00

Advanced human robot social interaction: goals, challenges and approaches

Sarah COSENTINO – Waseda University (Japon) UT3 Paul Sabatier, IRIT, Salle des Thèses

#seminaire

Lundi 20 Avril 2015, 13h30

Analyse de signaux multi-composantes: avancées théoriques et applications musicales

Dominique FOURER UT3 Paul Sabatier, IRIT, Salle des Thèses

#seminaire

Jeudi 21 Décembre 2023, 10h00

La parole : du traitement automatique à la mesure de l’intelligibilité

Jérôme FARINAS – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#hdr

Lundi 19 Mai 2014, 15h00

Segmentations sonore et audiovisuelle ?

Julien PINQUIER – Equipe SAMOVA – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#hdr

Jeudi 15 Juin 2023 – Samedi 17 Juin 2023

9es Journées de Phonétique Clinique (JPC2023)

UT2 Jean Jaurès, Maison de la Recherche

#journee

Jeudi 27 Mai 2021

Séminaire AFCP — Phonétique Clinique (en remplacement de JPC2021)

UT3 Paul Sabatier, En visioconférence

#journee

Mercredi 4 Septembre 2019 – Vendredi 6 Septembre 2019

Training Network on Automatic Processing of PAthological Speech (TAPAS) TE3: Data Collection, Management and Ethical Practices

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

Jeudi 4 Octobre 2018

2018 AIRBUS Air Traffic Control Challenge Workshop

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

Jeudi 8 Mars 2018

Traitement automatique de la parole et ressources pour la didactique de l’oral en L2 : variation, corpus, techniques

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

Mercredi 4 Octobre 2017

Workshop Language Didactics, Gestures & CALL

UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand

#journee

Équipe SAMOVA

Compétences

personnel de l’équipe

publications de l’équipe

contrats de l’équipe