publications de l’équipe

Articles dans des revues internationales
Articles dans des revues nationales
Rédaction de numéros spéciaux de revues
Conférences et workshops internationaux avec actes édités et comité de lecture
  • Thomas Pellegrini, Ismail Khalfaoui-Hassani, Etienne Labbé, Timothée Masquelier

    Adapting a ConvNeXt model to audio classification on AudioSet

    24th INTERSPEECH Conference (INTERSPEECH 2023), Aug 2023, Dublin, Ireland. à paraître

    Accès: https://ut3-toulouseinp.hal.science/hal-04114822

  • Sebastião Quintas, Julie Mauclair, Julien Pinquier

    Modélisation individuelle de juges pour la prédiction automatique de l’intelligibilité de la parole

    9èmes Journées de Phonétique Clinique (JPC 2023), Université Toulouse III Paul Sabatier; Université UT2J Toulouse Jean-Jaurès; Hôpitaux de Toulouse; Laboratoire Informatique d’Avignon, Jun 2023, Toulouse, France. à paraître

    Accès: https://hal.science/hal-04093783

  • Sebastião Quintas, Alberto Abad, Julie Mauclair, Virginie Woisard, Julien Pinquier

    Towards Reducing Patient Effort for the Automatic Prediction of Speech Intelligibility in Head and Neck Cancers

    48th International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2023), IEEE Signal Processing Society (SPS), Jun 2023, Rhodes, Greece. pp.1-5, ⟨10.1109/icassp49357.2023.10094921⟩

    Accès: https://hal.science/hal-04093771

  • Ismail Khalfaoui-Hassani, Thomas Pellegrini, Timothée Masquelier

    Dilated convolution with learnable spacings

    11th International Conference on Learning Representations (ICLR 2023), May 2023, Kigali, Rwanda. à paraître, ⟨10.48550/arXiv.2112.03740⟩

    Accès: https://hal.science/hal-04057309

  • Juan Manuel Coria, Hervé Bredin, Sahar Ghannay, Sophie Rosset

    Continual self-supervised domain adaptation for end-to-end speaker diarization

    IEEE Spoken Language Technology Workshop (SLT 2022), IEEE Speech and Language Processing Technical Committee, Jan 2023, Doha, Qatar. à paraître

    Accès: https://hal.science/hal-03824546

  • Sylvain Detey, Lionel Fontan, Isabelle Ferrané

    From Verbo-Tonal Method teachers’ training to Computer-Assisted Pronunciation Training tools: Insight from L3 pronunciation studies and automatic speech processing technology among Japanese learners of French

    11th Speech Research (SR 2022), Faculty of Humanities and Social Sciences, Zagreb, Croatia, Dec 2022, Zagreb, Croatia

    Accès: https://hal.science/hal-03924895

  • Verdiana De Fino, Lionel Fontan, Sylvain Detey, Isabelle Ferrané, Julien Pinquier

    Corpus de parole non-native et prédiction automatique du niveau de performance en expression orale : application à CLIJAF

    Journées Interphonologie du Français Contemporain (IPFC 2022), Dec 2022, Paris, France

    Accès: https://hal.science/hal-03946408

  • Lionel Fontan, Shinyoung Kim, Verdiana De Fino, Sylvain Detey

    Predicting speech fluency in children using automatic acoustic features

    Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2022), Asia-Pacific Signal and Information Processing Association (APSIPA), Nov 2022, Chiang Mai, Thailand. pp.1086-1091, ⟨10.23919/APSIPAASC55919.2022.9979884⟩

    Accès: https://hal.science/hal-03937320

  • Thomas Pellegrini

    Language-based audio retrieval with textual embeddings of tag names

    Workshop on Detection and Classification of Acoustic Scenes and Events (Workshop DCASE 2022), Nov 2022, Nancy, France. à paraître

    Accès: https://ut3-toulouseinp.hal.science/hal-03812737

  • Etienne Labbé, Thomas Pellegrini, Julien Pinquier

    Is my automatic audio captioning system so bad? spider-max: a metric to consider several caption candidates

    Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE 2022), Nov 2022, Nancy, France

    Accès: https://hal.science/hal-03810396v2

  • Conférences sans actes publiés
    Contributions à des ouvrages de synthèse
    Thèses et habilitations
  • Sebastião Quintas

    Deep learning approaches to assess speech intelligibility of head and neck cancer

    Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30272⟩

    Accès: https://theses.hal.science/tel-04094765

  • Estelle Randria

    Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?

    Informatique [cs]. Université Paul Sabatier (Toulouse 3), 2022. Français. ⟨NNT : 2022TOU30258⟩

    Accès: https://theses.hal.science/tel-04064038

  • Vincent Roger

    Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond : d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique

    Apprentissage [cs.LG]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30180⟩

    Accès: https://theses.hal.science/tel-03935738

  • Lucile Gelin

    Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes

    Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30031⟩

    Accès: https://theses.hal.science/tel-03715653

  • Léo Cances

    Apprentissage profond faiblement supervisé et semi-supervisé pour la détection d’évènements sonores

    Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30262⟩

    Accès: https://theses.hal.science/tel-03683219

  • Mathieu Balaguer

    Mesure de l’altération de la communication par analyses automatiques de la parole spontanée après traitement d’un cancer oral ou oropharyngé

    Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30109⟩

    Accès: https://theses.hal.science/tel-03557511

  • Nicolas Dauban

    Jusqu’où les goûts musicaux sont-ils prédictibles par l’intelligence artificielle ?

    Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30082⟩

    Accès: https://theses.hal.science/tel-03469458

  • Abdelwahab Heba

    Reconnaissance automatique de la parole à large vocabulaire : des approches hybrides aux approches End-to-End

    Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30116⟩

    Accès: https://theses.hal.science/tel-03616588

  • Abdelwahab Heba

    Reconnaissance automatique de la parole à large vocabulaire : des approches hybrides aux approches End-to-End

    Son [cs.SD]. Université toulouse 3 Paul Sabatier, 2021. Français. ⟨NNT : ⟩

    Accès: https://hal.science/tel-03269807

  • Wael Farid Youssef

    Instantiation of a textual description schema of video surveillance scenes

    Image Processing [eess.IV]. Université Paul Sabatier – Toulouse III, 2019. English. ⟨NNT : 2019TOU30249⟩

    Accès: https://theses.hal.science/tel-02965857

  • Rapports
  • Etienne Sicard, Anne Menin-Sicard

    La diadococinésie et son application en orthophonique clinique

    [Rapport de recherche] INSA 2020, INSA : Institut National des Sciences Appliquées de Toulouse. 2020

    Accès: https://hal.science/hal-02512856

  • Etienne Sicard, Anne Menin-Sicard

    Analyse de la qualité des phrases pour un bilan objectif de la parole

    [Rapport de recherche] INSA Toulouse. 2019

    Accès: https://hal.science/hal-02389764v2

  • Thomas Pellegrini, Céline Manenti, Julien Pinquier

    The IRIT-UPS system @ ZeroSpeech 2017

    [Research Report] IRIT. 2017

    Accès: https://hal.science/hal-03131886

  • Maëlys Salingre, Jérôme Farinas, Stéphane Rabant

    Automatic identification of French regional accent

    [Rapport de recherche] IRIT. 2017

    Accès: https://hal.science/hal-03120304

  • Rapports