publications de l’équipe
Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard
Development of a holistic communication score (HoCoS) in patients treated for oral or oropharyngeal cancer: Preliminary validation
International Journal of Language and Communication Disorders, 2023, 58 (1), pp.39-51. ⟨10.1111/1460-6984.12766⟩
Lionel Pibre, Jorge Francisco Madrigal Diaz, Cyrille Equoy, Frédéric Lerasle, Thomas Pellegrini, Julien Pinquier, Isabelle Ferrané
Audio-video fusion strategies for active speaker detection in meetings
Multimedia Tools and Applications, 2022, 2022, pp.1-26. ⟨10.1007/s11042-022-13746-7⟩
Léo Cances, Etienne Labbé, Thomas Pellegrini
Comparison of Semi-supervised Deep Learning Algorithms for Audio Classification
EURASIP Journal on Audio, Speech, and Music Processing, 2022, 2022 (1, article 23), pp.1-14. ⟨10.1186/s13636-022-00255-6⟩
Vincent Roger, Jérôme Farinas, Julien Pinquier
Deep neural networks for automatic speech processing: a survey from large corpora to limited data
EURASIP Journal on Audio, Speech, and Music Processing, 2022, article 19, pp.1-15. ⟨10.1186/s13636-022-00251-w⟩
Mathieu Balaguer, Timothy Pommée, Julien Pinquier, Jérôme Farinas, Virginie Woisard, Florence Sordes
Development and preliminary validation of the questionnaire ‘Evaluation of the constitution of social circles (ECSC)’ in patients treated for cancer of the upper aerodigestive tract
Folia Phoniatrica et Logopaedica, 2022, 75 (1), pp.52-66. ⟨10.1159/000525352⟩
Lionel Fontan, Libio Gonçalves Braz, Julien Pinquier, Michael Stone, Christian Füllgrabe
Using Automatic Speech Recognition to Optimize Hearing-Aid Time Constants
Frontiers in Neuroscience, 2022, 16 (779062), ⟨10.3389/fnins.2022.779062⟩
Libio Gonçalves Braz, Lionel Fontan, Julien Pinquier, Michael A Stone, Christian Füllgrabe
OPRA-RS: A Hearing-Aid Fitting Method Based on Automatic Speech Recognition and Random Search
Frontiers in Neuroscience, 2022, 16, pp.779048. ⟨10.3389/fnins.2022.779048⟩
Renée Speyer, Anna-Liisa Sutt, Liza Bergström, Shaheen Hamdy, Timothy Pommée, Mathieu Balaguer, Anett Kaale, Reinie Cordier
Neurostimulation in People with Oropharyngeal Dysphagia
Journal of Clinical Medicine, 2022, Special issue : Advances in Management of Voice and Swallowing Disorders, 11 (4), pp.993. ⟨10.3390/jcm11040993⟩
Chems-Eddine Himeur, Thibault Lejemble, Thomas Pellegrini, Mathias Paulin, Loic Barthe, Nicolas Mellado
PCEDNet : A Lightweight Neural Network for Fast and Interactive Edge Detection in 3D Point Clouds
ACM Transactions on Graphics, 2022, 41 (1), pp.1-21. ⟨10.1145/3481804⟩
Renée Speyer, Reinie Cordier, Anna-Liisa Sutt, Lianne Remijn, Bas Joris Heijnen, Mathieu Balaguer, Timothy Pommée, Michelle Mcinerney, Liza Bergström
Behavioural Interventions in People with Oropharyngeal Dysphagia
Journal of Clinical Medicine, 2022, Special issue, 11 (3), pp.685. ⟨10.3390/jcm11030685⟩
-
Sylvain Detey, Lionel Fontan, Thomas Pellegrini
Traitement de la prononciation en langue étrangère : approches didactiques, méthodes automatiques et enjeux pour l’apprentissage
Dans : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 57, N. 3, (en ligne), 2016.
Accès : https://www.atala.org/Traitement-de-la-prononciation-en – https://oatao.univ-toulouse.fr/19173/
BibTeX -
Lionel Fontan, Cynthia Magnen, Julien Tardieu, Isabelle Ferrané, Julien Pinquier, Jérôme Farinas, Pascal Gaillard, Xavier Aumont
Comparaison de mesures perceptives et automatiques de l’intelligibilité : application à de la parole simulant la presbyacousie
Dans : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 55, N. 2, p. 151-174, mars 2015.
Résumé Accès : http://www.atala.org/Comparaison-de-mesures-perceptives – https://oatao.univ-toulouse.fr/15274/
BibTeX -
Blandine Boudet, Thérèse Giacobini, Isabelle Ferrané, Carine Fortin, Christophe Mollaret, Frédéric Lerasle, Pierre Rumeau
Quels sont les objets égarés à domicile par les personnes âgées fragiles ? Une étude pilote sur 60 personnes.
Dans : Neurologie – Psychiatrie – Gériatrie (NPG), Elsevier, Vol. Vol. 14/79, p. 38-42, 2014.
-
David Janiszek, Damien Pellier, Julie Mauclair, Laetitia Boulc’H, Jean-Louis Baron, Yannick Parchemal
Utilisation de la robotique pédagogique pour enseigner l’intelligence artificielle : une expérience d’approche par projet auprès d’étudiants en informatique.
Dans : Sciences et Technologies de l’Information et de la Communication pour l’Éducation et la Formation (STICEF), Association des Technologies de l’Information pour l’Education et la Formation, Paris, Vol. 18, (en ligne), 2011.
Accès : http://sticef.univ-lemans.fr/num/vol2011/07r-janiszek/sticef_2011_janiszek_07rp.html
BibTeX -
Jérôme Farinas, Jean-Luc Rouas, François Pellegrino, Régine André-Obrecht
Extraction automatique de paramètres prosodiques pour l’identification automatique des langues
Dans : Traitement du Signal, GRETSI : Groupement de Recherche en Traitement du Signal et des Images, Vol. 22, N. 2, p. 81-97, 2005.
Accès : http://documents.irevues.inist.fr/bitstream/handle/2042/2443/02%22Andr%E9-Obrecht+couleur.pdf?sequence=1
BibTeX -
Julien Pinquier, Jean-Luc Rouas, Régine André-Obrecht
Fusion de paramètres pour une classification automatique parole/musique robuste
Dans : Technique et science informatiques (TSI) : Fusion numérique/symbolique, Hermès, 8, quai du marche neuf, F-75004 Paris, Vol. 22, p. 831-852, 2003.
-
Régine André-Obrecht, Abdelouafi Meziane, Bruno Jacob
Modélisation de la durée des sons dans un système de reconnaissance automatique de la parole
Dans : Comptes Rendus de l’Académie des Sciences, Académie des Sciences, Elsevier, Paris, Vol. t327 série IIb, p. 379-382, 1999.
-
Philippe Ercolessi, Christine Senac, Hervé Bredin, Sandrine Mouysset
Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d’histoires
Dans : Revue des Sciences et Technologies de l’Information, Hermès Science, Vol. 15 N. 2, pp. 41-66, 2012.
-
Ebroul Iquierdo, Jenny Bennois-Pineau, Régine André-Obrecht
Special Issue on Content Based Multimedia Indexing and Retrieval
Dans : Signal Processing: Image Communication, Elsevier, Vol. 22, Issues 7-8, 2007.
-
Special Issue on Speaker Recognition and its Commercial and Forensic Applications
Dans : International Journal Speech Communication, N.H Elsevier ISSN 0167-6393, North Holland, Vol. 31, Nos 2-3, juin 2000.
-
Efficient Automatic Analysis of Camera Work and Microsegmentation of Video Using Spatio-Temporal Images
Dans : Signal Processing : Image Communication, Elsevier, Eurasip, Amsterdam, Vol. 8(4), mai 1996.
Thomas Pellegrini, Ismail Khalfaoui-Hassani, Etienne Labbé, Timothée Masquelier
Adapting a ConvNeXt model to audio classification on AudioSet
24th INTERSPEECH Conference (INTERSPEECH 2023), Aug 2023, Dublin, Ireland. à paraître
Sebastião Quintas, Julie Mauclair, Julien Pinquier
Modélisation individuelle de juges pour la prédiction automatique de l’intelligibilité de la parole
9èmes Journées de Phonétique Clinique (JPC 2023), Université Toulouse III Paul Sabatier; Université UT2J Toulouse Jean-Jaurès; Hôpitaux de Toulouse; Laboratoire Informatique d’Avignon, Jun 2023, Toulouse, France. à paraître
Sebastião Quintas, Alberto Abad, Julie Mauclair, Virginie Woisard, Julien Pinquier
Towards Reducing Patient Effort for the Automatic Prediction of Speech Intelligibility in Head and Neck Cancers
48th International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2023), IEEE Signal Processing Society (SPS), Jun 2023, Rhodes, Greece. pp.1-5, ⟨10.1109/icassp49357.2023.10094921⟩
Ismail Khalfaoui-Hassani, Thomas Pellegrini, Timothée Masquelier
Dilated convolution with learnable spacings
11th International Conference on Learning Representations (ICLR 2023), May 2023, Kigali, Rwanda. à paraître, ⟨10.48550/arXiv.2112.03740⟩
Juan Manuel Coria, Hervé Bredin, Sahar Ghannay, Sophie Rosset
Continual self-supervised domain adaptation for end-to-end speaker diarization
IEEE Spoken Language Technology Workshop (SLT 2022), IEEE Speech and Language Processing Technical Committee, Jan 2023, Doha, Qatar. à paraître
Sylvain Detey, Lionel Fontan, Isabelle Ferrané
From Verbo-Tonal Method teachers’ training to Computer-Assisted Pronunciation Training tools: Insight from L3 pronunciation studies and automatic speech processing technology among Japanese learners of French
11th Speech Research (SR 2022), Faculty of Humanities and Social Sciences, Zagreb, Croatia, Dec 2022, Zagreb, Croatia
Verdiana De Fino, Lionel Fontan, Sylvain Detey, Isabelle Ferrané, Julien Pinquier
Corpus de parole non-native et prédiction automatique du niveau de performance en expression orale : application à CLIJAF
Journées Interphonologie du Français Contemporain (IPFC 2022), Dec 2022, Paris, France
Lionel Fontan, Shinyoung Kim, Verdiana De Fino, Sylvain Detey
Predicting speech fluency in children using automatic acoustic features
Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2022), Asia-Pacific Signal and Information Processing Association (APSIPA), Nov 2022, Chiang Mai, Thailand. pp.1086-1091, ⟨10.23919/APSIPAASC55919.2022.9979884⟩
Language-based audio retrieval with textual embeddings of tag names
Workshop on Detection and Classification of Acoustic Scenes and Events (Workshop DCASE 2022), Nov 2022, Nancy, France. à paraître
Etienne Labbé, Thomas Pellegrini, Julien Pinquier
Is my automatic audio captioning system so bad? spider-max: a metric to consider several caption candidates
Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE 2022), Nov 2022, Nancy, France
-
IRIT, un acteur de la recherche en Santé et Autonomie, Axe stratégique “Systèmes Informatiques pour la Santé et l’Autonomie”, composante gestion de données
Dans : Université d’été de la e-santé, Castres, France, 05/07/16 (conférencier invité).
-
La parole « non-standard » : un défi pour les outils de traitement automatique de la parole
Dans : Journée d’étude Regards Croisés sur la Voix, Strasbourg, 10/06/16.
Accès : https://www.irit.fr/~Thomas.Pellegrini/pdf/slides_Pellegrini_strasbourg_Juin2016.pdf
BibTeX -
Lionel Fontan, Thomas Pellegrini, Jérôme Farinas, Julie Mauclair, Vincent Laborde, Halima Sahraoui, Xavier Aumont, Júlia Olcoz, Alberto Abad
Vers des outils automatiques pour l’évaluation de locuteurs atypiques
Dans : Colloque Interphonologie du Français Contemporain Evaluation de la parole non native et corpus oraux, Paris, 08/12/15.
Accès : http://cblle.tufs.ac.jp/ipfc/assets/files/IPFC2015-Paris/IPFC2015_Fontan%20et%20al.pdf
BibTeX -
Thomas Pellegrini, Lionel Fontan
Utilisation d’algorithmes de Goodness of Pronunciation pour l’évaluation de la compréhensibilité de la parole pathologique
Dans : 6èmes Journées de Phonétique Clinique, Montpellier, 29/06/15-01/07/15.
-
Blandine Boudet, Carine Fortin, Thérèse Giacobini, Christophe Mollaret, Isabelle Ferrané, Frédéric Lerasle, Pierre Rumeau
Etude pilote des objets recherchés sur une population de 60 personnes âgées ambulatoires – poster
Dans : 33èmes journées annuelles de la société française de gériatrie et gérontologie, Paris, 08/10/13-10/10/13.
-
Sebastian Schmiedeke, Christoph Kofler, Isabelle Ferrané
Overview of MediaEval 2012 Genre Tagging Task
Dans : MediaEval 2012 Workshop, Pisa, Italy, 04/10/12-05/10/12.
Accès : http://ceur-ws.org/Vol-927/mediaeval2012_submission_2.pdf
BibTeX -
Patrice Guyot, Julien Pinquier
Reconnaissance automatique de sons d’eau, une approche acoustique et perceptive (poster)
Dans : Journées Jeunes Chercheurs en Audition, Acoustique musicale et Signal audio (JJCAAS), LMA, Marseille, 05/12/12-07/12/12.
-
Patrice Guyot, Julien Pinquier, Olivier Houix, Nicolas Misdariis, Patrick Susini
Reconnaissance automatique et catégorisation perceptive de sons liquides (poster)
Dans : Deuxièmes Journées Perception Sonore, LMA, Marseille, 10/12/12-11/12/12.
-
Patrice Guyot, Julien Pinquier
Reconnaissance automatique de sons environnementaux (poster)
Dans : Journées Jeunes Chercheurs en Audition, Acoustique musicale et Signal audio (JJCAAS), Orange Labs, Rennes, 07/12/11-09/12/11.
-
Philippe Ercolessi, Christine Senac, Hervé Bredin, Philippe Joly
Summarizing Video Collection using Semantic Graph
Dans : Workshop IRIT/Kyushu Image et Multimedia, Toulouse – France, 24/11/11-25/11/11.
Accès : https://www.irit.fr/publis/SAMOVA/ercolessiWorkshop2011.pdf
BibTeX
-
Automatic correction of adverb placement errors for CALL
Dans : Eurocall12. G Lund (Eds.) , EUROCALL Association, (support électronique), juillet 2012.
-
Hervé Bredin, Aurélien Mayoue, Gérard Chollet
Talking-Face Verification
Dans : Guide to Biometric Reference Systems and Performance Evaluation. Dijana Petrovska, Gérard Chollet, Bernadette Dorizzi (Eds.) , Springer, 10, p. 297-326, 2009.
-
Brice Burger, Isabelle Ferrané, Frédéric Lerasle
Towards multimodal interface for interactive robots: challenges and robotic systems description
Dans : Cutting Edge Robotics 2009. Kordic Vedran (Eds.) , INTECH, (en ligne), août 2009.
Accès : http://intechweb.org/invitations.php?code=4b5cb9fc911b854ff9bd08e5a7ad866f&PHPSESSID=7d013daoo3i48pshqjg610amf7
BibTeX -
Iterated Function Systems and some generalizations: Local Regularity Analysis and Multifractal Modeling of Signals
Dans : Scaling Laws, Fractals and Wavelets. Patrice Abry, Paulo Gonçalves, Jacques Lévy Véhel (Eds.) , ISTE – WILEY, p. 301-332, janvier 2009.
-
Gérard Chollet, Rémi Landais, Thomas Hueber, Hervé Bredin, Chafic Mokbel, Patrick Perrot, Leila Zouari
Some Experiments in Audio-Visual Speech Processing
Dans : Advances in Nonlinear Speech Processing. Mohamed Chetouani (Eds.) , Springer-Verlag, p. 28-56, Vol. 4885/2007, LNCS, 2007.
-
Bouchra Abboud, Hervé Bredin, Guido Aversano , Gérard Chollet
Audio-visual Identity Verification: An Introductory Overview
Dans : Progress in Nonlinear Speech Processing. Yannis Stylianou, Marcos Faundez-Zanuy, Anna Eposito (Eds.) , Springer-Verlag, p. 118-134, Vol. 4391/2007, LNCS, 2007.
-
Descriptions des séquences d’images
Dans : L’indexation multimédia Description et recherche automatiques. P. Gros (Eds.) , Hermès, p. 119-136, Traité IC2, série Traitement du signal et de l’image, mai 2007.
-
Jorge Gutierrez, Jean-Luc Rouas, Régine André-Obrecht
Application of uncertainty-based methods to fuse language identification expert decision
Dans : Modern Information Processing: From Theory to Application (Selected Papers of the IPMU’2004). B. Bouchon-Meunier, G. Coletti, R.R. Yager (Eds.) , Elsevier, p. 255-268, 2006.
-
Farah Benamara, Véronique Moriceau
Prepositions in Cooperative Question-Answering Systems: a Preliminary Analysis
Dans : Syntax and semantics of prepositions. Patrick Saint-Dizier (Eds.) , Springer, p. 307-330, Vol. 29, Text, Speech and Language Technology, novembre 2006.
Accès : http://www.springerlink.com/content/978-1-4020-3873-0
BibTeX -
Enjeux d’une normalisation pour l’indexation des contenus multimédia
Dans : Paradigmes et enjeux de l’informatique. N Bidoit, L Fariñas del Cerro, S Fdida, B Vallée (Eds.) , Hermès Science, p. 157-169, Informatique et Systèmes d’Information, février 2005.
-
Synchronisation automatique d’un contenu audio-visuel avec un texte qui le décrit
Thèse de doctorat, Université de Toulouse, juillet 2016.
Résumé Accès : http://thesesups.ups-tlse.fr/3224/1/2016TOU30104.pdf
BibTeX -
Segmentation et regroupement en chanteurs. Application aux enregistrements ethnomusicologiques
Thèse de doctorat, Université Paul Sabatier, juin 2016.
-
Perception multimodale de l’homme pour l’Interaction Homme-Robot
Thèse de doctorat, Université Paul Sabatier, décembre 2015.
-
Segmentations sonore et audiovisuelle ?
Habilitation à diriger des recherches, Université Paul Sabatier, mai 2014.
Accès : https://www.irit.fr/~Julien.Pinquier/Docs/HDR_Pinquier.pdf
BibTeX -
Spectre de rythme et sources multiples : au coeur des contenus ethnomusicologiques et sonores
Thèse de doctorat, Université des Sciences Sociales, juillet 2014.
Résumé Accès : http://publications.ut-capitole.fr/16314/1/LeCozMaxime-2014.pdf
BibTeX -
Caractérisation et reconnaissance de sons d’eau pour le suivi des activités de la vie quotidienne. Une approche fondée sur le signal, l’acoustique et la perception.
Thèse de doctorat, Université Paul Sabatier, mars 2014.
-
Extraction multimodale de la structure narrative des épisodes de séries télévisées
Thèse de doctorat, Université de Toulouse, septembre 2013.
-
Masquage de pertes de paquets en voix sur IP
Thèse de doctorat, Institut National Polytechnique de Toulouse, janvier 2011.
Résumé Accès : http://ethesis.inp-toulouse.fr/archive/00001455/
BibTeX -
Recherche du rôle des intervenants et de leurs interactions pour la structuration de documents audiovisuels
Thèse de doctorat, Université Paul Sabatier, juillet 2011.
Résumé Accès : http://tel.archives-ouvertes.fr/tel-00632119/fr/ – https://www.irit.fr/publis/SAMOVA/TH/manuscritTheseBigot2011.pdf
BibTeX -
Unsupervised Video Indexing based on Audiovisual Characterization of Persons
Thèse de doctorat, Université de Toulouse, juin 2010.
Accès : http://tel.archives-ouvertes.fr/docs/00/51/54/74/PDF/TheseElie.pdf
BibTeX
-
Recherche des expressions clés caractéristiques de linteraction entre locuteurs dans les documents audiovisuels
Rapport de Master, Université Paul Sabatier, juin 2011.
Résumé Accès : https://www.irit.fr/publis/SAMOVA/M2R/Memoire_M2R_ArchangeDestine.pdf
BibTeX -
Indexation en intervenant d’un document vidéo par identification du visage
Rapport de Master, Université Paul Sabatier, juin 2007.
Accès : https://www.irit.fr/publis/SAMOVA/Memoire_M2R_Noureddine.pdf
BibTeX -
Description de comportements humains et interrogation.
Rapport de Master, Université de Toulouse, juin 2006.
Accès : http://www.phdgroup.org/ul-stsi-2005-2006.php
BibTeX -
Caractérisation de la voix chantée
Rapport de Master, Institut National Polytechnique de Toulouse, juin 2006.
-
Application des matrices de similarité à la comparaison de contenus sonores
Rapport de Master, Université Paul Sabatier, juin 2006.
-
Segmentation et regroupement en locuteurs d’un document sonore
Rapport de Master, Université Paul Sabatier, juin 2006.
-
Caractérisation d’un intervenant dans un document audiovisuel
Rapport de stage, Master Recherche 2IH, Université Paul Sabatier, juin 2005.
-
Etude constractive de décodeurs acoustico-phonétique
Rapport de stage, Master Recherche 2IH, Université Paul Sabatier, juin 2005.
-
Contribution à l’indexation multimedia
Rapport de recherche, IRIT/2005-8-R, IRIT, mars 2005.
-
Méthodes à vecteurs de support et indexation sonore
Rapport de stage, DEA IIL, Université Paul Sabatier, 2004.