Équipe SAMOVA

Responsable :


 

Les travaux de l’équipe SAMoVA se placent dans le contexte de l’indexation et de la recherche de documents audio et vidéo. Notre recherche s’appuie sur le traitement du signal, la modélisation, ainsi que sur la structuration du contenu audiovisuel.

Compétences

Segmentation, indexation et structuration audio et vidéo
Parole, musique et sons environnementaux
Interaction conversationnelle multimodale
Traitement de la parole pathologique et de la perte auditive
Apprentissage profond pour l'analyse audio et vidéo

personnel de l’équipe

Membres permanents
    Membres non – permanents
      Membres rattachés

        publications de l’équipe

        Articles dans des revues internationales
      • Chems-Eddine Himeur, Thibault Lejemble, Thomas Pellegrini, Mathias Paulin, Loic Barthe, Nicolas Mellado

        PCEDNet : A Lightweight Neural Network for Fast and Interactive Edge Detection in 3D Point Clouds

        ACM Transactions on Graphics, Association for Computing Machinery, 2022, 41 (1), pp.1-21. ⟨10.1145/3481804⟩

        Accès: https://hal.archives-ouvertes.fr/hal-03349971

      • Lucile Gelin, Morgane Daniel, Julien Pinquier, Thomas Pellegrini

        End-to-end acoustic modelling for phone recognition of young readers

        Speech Communication, Elsevier : North-Holland, 2021, 134, pp.71-84. ⟨10.1016/j.specom.2021.08.003⟩

        Accès: https://hal.archives-ouvertes.fr/hal-03373156

      • Virginie Woisard, Corine Astésano, Mathieu Balaguer, Jérome Farinas, Corinne Fredouille, Pascal Gaillard, Alain Ghio, Laurence Giusti, Imed Laaridh, Muriel Lalain, Benoit Lepage, Julie Mauclair, Olivier Nocaudie, Julien Pinquier, Gilles Pouchoulin, Michèle Puech, Danièle Robert, Vincent Roger

        C2SI corpus: a database of speech disorder productions to assess intelligibility and quality of life in head and neck cancers

        Language Resources and Evaluation, Springer Verlag, 2021, 55 (1), pp.173-190. ⟨10.1007/s10579-020-09496-3⟩

        Accès: https://hal.archives-ouvertes.fr/hal-02921918

      • Geoffrey Roman Jimenez, Patrice Guyot, Thierry Malon, Sylvie Chambon, Vincent Charvillat, Alain Crouzil, André Péninou, Julien Pinquier, Florence Sèdes, Christine Senac

        Improving vehicle re‐identification using CNN latent spaces: Metrics comparison and track‐to‐track extension

        IET Computer Vision, IET, 2021, 15 (2), pp.85-98. ⟨10.1049/cvi2.12010⟩

        Accès: https://hal.archives-ouvertes.fr/hal-03126045v2

      • Timothy Pommée, Mathieu Balaguer, Julie Mauclair, Julien Pinquier, Virginie Woisard

        Assessment of adult speech disorders: current situation and needs in French-speaking clinical practice

        Logopedics Phoniatrics Vocology, Taylor & Francis, 2021, pp.1-15. ⟨10.1080/14015439.2020.1870245⟩

        Accès: https://hal.archives-ouvertes.fr/hal-03120115

      • Annalisa Paroni, Nathalie Henrich Bernardoni, Christophe Savariaux, Hélène Loevenbruck, Pascale Calabrese, Thomas Pellegrini, Sandrine Mouysset, Silvain Gerber

        Vocal drum sounds in human beatboxing: An acoustic and articulatory exploration using electromagnetic articulography

        Journal of the Acoustical Society of America, Acoustical Society of America, 2021, 149 (1), pp.191-206. ⟨10.1121/10.0002921⟩

        Accès: https://hal.univ-grenoble-alpes.fr/hal-03107358

      • Virginie Woisard, Mathieu Balaguer, Corinne Fredouille, Jérôme Farinas, Alain Ghio, Muriel Lalain, Michèle Puech, Corine Astesano, Julien Pinquier, Benoît Lepage

        Construction of an automatic score for the evaluation of speech disorders among patients treated for a cancer of the oral cavity or the oropharynx: The Carcinologic Speech Severity Index

        Head and Neck, Wiley, In press, ⟨10.1002/hed.26903⟩

        Accès: https://hal-univ-tlse3.archives-ouvertes.fr/hal-03413678

      • Mathieu Balaguer, Timothy Pommée, Jérome Farinas, Julien Pinquier, Virginie Woisard, Renée Speyer

        Effects of oral and oropharyngeal cancer on speech intelligibility using acoustic analysis: Systematic review

        Head and Neck, Wiley, 2020, 42 (1), pp.111-130. ⟨10.1002/hed.25949⟩

        Accès: https://hal.archives-ouvertes.fr/hal-02492761

      • Mathieu Balaguer, Maëlle Champenois, Jérôme Farinas, Julien Pinquier, Virginie Woisard

        The (head and neck) carcinologic handicap index: validation of a modular type questionnaire and its ability to prioritise patients’ needs

        European Archives of Oto-Rhino-Laryngology, Springer Verlag, In press, ⟨10.1007/s00405-020-06201-6⟩

        Accès: https://hal.archives-ouvertes.fr/hal-02899287

      • Mathieu Balaguer, Jérome Farinas, Pascale Fichaux-Bourin, Michèle Puech, Julien Pinquier, Virginie Woisard

        Validation of the French Versions of the Speech Handicap Index and the Phonation Handicap Index in Patients Treated for Cancer of the Oral Cavity or Oropharynx

        Folia Phoniatrica et Logopaedica, Karger, In press, ⟨10.1159/000503448⟩

        Accès: https://hal.archives-ouvertes.fr/hal-02505354

      • Articles dans des revues nationales
      • Mathieu Balaguer, Timothy Pommée, Jérôme Farinas, Julien Pinquier, Virginie Woisard

        Paramètres perceptifs expliquant la sévérité du trouble de parole mesurée automatiquement en cancérologie ORL

        Rééducation orthophonique, Ortho édition, 2021, Chapitre : “De l’exploration à la prise en soins de la voix chez l’adulte : données actuelles.. sur la voie des voix”, 286, pp.1-13

        Accès: https://hal-univ-tlse3.archives-ouvertes.fr/hal-03277422

      • Mathieu Balaguer, Josiane Percodani, Virginie Woisard

        Le Carcinologic Handicap Index (CHI) : questionnaire d’autoévaluation du handicap à destination des patients traités pour cancer des VADS

        Annales françaises d’Oto-rhino-laryngologie et de Pathologie Cervico-faciale, Elsevier, United States, 2017, 134 (6), pp.382-387. ⟨10.1016/j.aforl.2016.07.021⟩

        Accès: https://hal.archives-ouvertes.fr/hal-02553232

      • 503 Service Temporarily Unavailable

        Service Temporarily Unavailable

        The server is currently unable to handle the request due to a temporary overloading or maintenance of the server.

        503 Service Temporarily Unavailable

        Service Temporarily Unavailable

        The server is currently unable to handle the request due to a temporary overloading or maintenance of the server.

        Conférences et workshops internationaux avec actes édités et comité de lecture
      • Quentin Portes, Julien Pinquier, Frédéric Lerasle, José Mendes Carvalho

        Multimodal human interaction analysis in vehicle cockpit

        IEEE International Intelligent Transportation Systems Conference (ITSC 2021), Sep 2021, Indianapolis, United States. pp.2118-2124, ⟨10.1109/ITSC48978.2021.9564792⟩

        Accès: https://hal.archives-ouvertes.fr/hal-03445480

      • Quentin Portes, Julien Pinquier, Frédéric Lerasle, Jose Mendes-Carlalho

        Analyse multimodale d’interaction humaine dans le cockpit d’un véhicule

        18èmes journées francophones des jeunes chercheurs en vision par ordinateur (ORASIS 2021), Centre National de la Recherche Scientifique [CNRS]; Equipe REVA, IRIT : Institut de Recherche en Informatique de Toulouse, Sep 2021, Saint Ferréol, France

        Accès: https://hal.archives-ouvertes.fr/hal-03339623

      • Lucile Gelin, Thomas Pellegrini, Julien Pinquier, Morgane Daniel

        Simulating reading mistakes for child speech Transformer-based phone recognition

        Annual Conference of the International Speech Communication Association (INTERSPEECH), Aug 2021, Brno, Czech Republic

        Accès: https://hal.archives-ouvertes.fr/hal-03257870

      • Hervé Bredin, Antoine Laurent

        End-to-end speaker segmentation for overlap-aware resegmentation

        Interspeech 2021, Aug 2021, Brno, Czech Republic

        Accès: https://hal-univ-lemans.archives-ouvertes.fr/hal-03257524

      • Thomas Pellegrini

        Deep-learning-based central African primate species classification with MixUp and SpecAugment

        Interspeech 2021, Aug 2021, Brno, Czech Republic

        Accès: https://hal-univ-tlse3.archives-ouvertes.fr/hal-03298384

      • Corentin Hembise, Lucile Gelin, Morgane Daniel

        Lalilo: a reading assistant for children featuring speech recognition-based reading mistake detection

        Annual Conference of the International Speech Communication Association (INTERSPEECH), Show & Tell contribution, Aug 2021, Brno, Czech Republic

        Accès: https://hal.archives-ouvertes.fr/hal-03410194

      • Robin Vaysse, Jérôme Farinas, Corine Astésano, Régine André-Obrecht

        Automatic extraction of speech rhythm descriptors for speech intelligibility assessment in the context of Head and Neck Cancers

        INTERSPEECH 2021, ISCA : International Speech and Communication Association, Aug 2021, Brno, Czech Republic

        Accès: https://hal-univ-tlse3.archives-ouvertes.fr/hal-03269227

      • Lionel Pibre, Sélim Mechrouh, Thomas Pellegrini, Julien Pinquier, Isabelle Ferrané

        Automatic macro segmentation into interaction sequence: a silence-based approach for meeting structuring

        Content-Based Multimedia Indexing (CBMI 2021), University of Lille – France, Jun 2021, Lille, France

        Accès: https://hal.archives-ouvertes.fr/hal-03273029

      • Ileana Ober, Philippe Joly, Jaroslav Nosek

        About the Double Degree Master’s Programs between University Toulouse III-Paul Sabatier and Technical University of Liberec

        2021 IEEE International Workshop of Electronics, Control, Measurement, Signals and their application to Mechatronics (ECMSM), Jun 2021, Liberec, France. pp.1-4, ⟨10.1109/ECMSM51310.2021.9468839⟩

        Accès: https://hal.archives-ouvertes.fr/hal-03443921

      • Léo Cances, Thomas Pellegrini

        Comparison of Deep Co-Training and Mean-Teacher approaches for semi-supervised audio tagging

        IEEE 46th International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021), IEEE Signal Processing Society’s, Jun 2021, Toronto, Canada

        Accès: https://hal.archives-ouvertes.fr/hal-03170277

      • Conférences et workshops nationaux avec actes édités et comité de lecture
      • Mathieu Balaguer, Lucile Gelin, Virginie Woisard, Jérôme Farinas, Julien Pinquier

        Mesure de l’intelligibilité après cancer oral ou oropharyngé par un système de reconnaissance automatique de la parole

        1ère Journée Scientifique d’Orthophonie, SURO Société Universitaire de Recherche en Orthophonie, Oct 2021, Congrès en ligne, France

        Accès: https://hal-univ-tlse3.archives-ouvertes.fr/hal-03412659

      • Alain Ghio, Jérôme Farinas

        La laryngophoniatrie du futur

        Congrès National de la Société Française d’ORL, 2021, Paris, France

        Accès: https://hal.archives-ouvertes.fr/hal-03365266v3

      • Sébastien Ferreira, Jérome Farinas, Julien Pinquier, Stéphane Rabant

        Analyse du bruit pour la prédiction de la qualité de la transcription automatique de la parole

        27e Colloque du Groupe de Recherche sur le Traitement du Signal et des Images (GRETSI 2019), Aug 2019, Lille, France. pp.1-4

        Accès: https://hal.archives-ouvertes.fr/hal-02950726

      • Julien Pinquier, Jérome Farinas, Xavier de Boissezon, Patrice Peran, Lola Danet, Mélanie Jucla

        EVOLEX : apport de la reconnaissance vocale pour le diagnostic des dysfonctionnements cognitifs légers

        8e Journees de Phonetique Clinique (JPC 2019), May 2019, Mons, Belgique. pp.105-106

        Accès: https://hal.archives-ouvertes.fr/hal-02442023

      • Virginie Woisard, Jérome Farinas, Corine Astesano

        Intelligibilité de la parole et qualité de vie. Réflexions à partir des résultats de l’étude «carcinologic speech severity index»

        8e Journees de Phonetique Clinique (JPC 2019), May 2019, Mons, Belgique. pp.15-16

        Accès: https://hal.archives-ouvertes.fr/hal-02453124

      • Marc Moreaux, Michaël Garcia Ortiz, Isabelle Ferrané, Frédéric Lerasle

        Localisation sonore par attention et apprentissage profond semi-supervisé

        Congrès Francophone de Reconnaissance des Formes et Intelligence Artificielle (RFIA), Jun 2018, Marne-la-Vallée, France. pp.1-3

        Accès: https://hal.archives-ouvertes.fr/hal-02289999

      • Sébastien Ferreira, Jérome Farinas, Julien Pinquier, Stéphane Rabant

        Prédiction a priori de la qualité de la transcription automatique de la parole bruitée

        32e Journées d’Etudes sur la Parole (JEP 2018), Jun 2018, Aix-En-Provence, France. pp.249-257

        Accès: https://hal.archives-ouvertes.fr/hal-02124434

      • Christine Sènac, Thomas Pellegrini, Julien Pinquier, Florian Mouret

        Réseaux de neurones convolutifs et paramètres musicaux pour la classification en genres

        XXVIe Colloque GRETSI sur le Traitement du Signal et des Images (GRETSI 2017), Sep 2017, Juan-les-pins, France. pp.1-5

        Accès: https://hal.archives-ouvertes.fr/hal-02871339

      • Céline Manenti, Thomas Pellegrini, Julien Pinquier

        Identification non-supervisée de pseudo-phones à l’aide de k-means et de réseaux convolutifs

        26e Colloque GRETSI sur le Traitement du Signal et des Images (GRETSI 2017), Sep 2017, Juan-les-Pins, France. pp.1-4

        Accès: https://hal.archives-ouvertes.fr/hal-02559763

      • 503 Service Temporarily Unavailable

        Service Temporarily Unavailable

        The server is currently unable to handle the request due to a temporary overloading or maintenance of the server.

        Livres (monographies)
      • Alexandre Boyer, Etienne Sicard

        Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC

        Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1

        Accès: https://hal.archives-ouvertes.fr/hal-01951651

      • 503 Service Temporarily Unavailable

        Service Temporarily Unavailable

        The server is currently unable to handle the request due to a temporary overloading or maintenance of the server.

        Thèses et habilitations
      • Abdelwahab Heba

        Reconnaissance automatique de la parole à large vocabulaire : des approches hybrides aux approches End-to-End

        Son [cs.SD]. Université toulouse 3 Paul Sabatier, 2021. Français

        Accès: https://hal.archives-ouvertes.fr/tel-03269807

      • Wael Farid Youssef

        Instantiation of a textual description schema of video surveillance scenes

        Image Processing [eess.IV]. Université Paul Sabatier – Toulouse III, 2019. English. ⟨NNT : 2019TOU30249⟩

        Accès: https://tel.archives-ouvertes.fr/tel-02965857

      • Céline Manenti

        Découverte d’unités linguistiques à l’aide de méthodes d’apprentissage non supervisé

        Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2019. Français. ⟨NNT : 2019TOU30074⟩

        Accès: https://tel.archives-ouvertes.fr/tel-02893779

      • François-Xavier Decroix

        Apprentissage en ligne de signatures audiovisuelles pour la reconnaissance et le suivi de personnes au sein d’un réseau de capteurs ambiants

        Acoustique [physics.class-ph]. Université Paul Sabatier – Toulouse III, 2017. Français. ⟨NNT : 2017TOU30298⟩

        Accès: https://tel.archives-ouvertes.fr/tel-01988112

      • 503 Service Temporarily Unavailable

        Service Temporarily Unavailable

        The server is currently unable to handle the request due to a temporary overloading or maintenance of the server.

        Rapports
      • Etienne Sicard, Anne Menin-Sicard

        La diadococinésie et son application en orthophonique clinique

        [Rapport de recherche] insa toulouse. 2020

        Accès: https://hal.archives-ouvertes.fr/hal-02512856

      • Etienne Sicard, Anne Menin-Sicard

        Analyse de la qualité des phrases pour un bilan objectif de la parole

        [Rapport de recherche] INSA Toulouse. 2019

        Accès: https://hal.archives-ouvertes.fr/hal-02389764v2

      • Thomas Pellegrini, Céline Manenti, Julien Pinquier

        The IRIT-UPS system @ ZeroSpeech 2017

        [Research Report] IRIT. 2017

        Accès: https://hal.archives-ouvertes.fr/hal-03131886

      • Maëlys Salingre, Jérôme Farinas, Stéphane Rabant

        Automatic identification of French regional accent

        [Rapport de recherche] IRIT. 2017

        Accès: https://hal.archives-ouvertes.fr/hal-03120304

      • 503 Service Temporarily Unavailable

        Service Temporarily Unavailable

        The server is currently unable to handle the request due to a temporary overloading or maintenance of the server.

        contrats de l’équipe

        AcronymeTitreResp. scDébut – fin
        AcronymeTitreResp. scDébut – fin
        AcronymeTitreResp. scDébut – fin
        Mardi 30 Novembre 2021, 14h00
        Les mesures d’intelligibilité : État de l’art, considérations pratiques pour l’applicabilité clinique et explorations acoustiques
        Timothy POMMÉE – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand et en visioconférence
        #these
        Mardi 12 Octobre 2021, 14h00
        Mesure de l’altération de la communication par analyses automatiques de la parole spontanée après traitement d’un cancer oral ou oropharyngé
        Mathieu BALAGUER – Equipe SAMOVA, IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
        #these
        Vendredi 21 Mai 2021, 13h30
        Prédiction a priori de la qualité de la transcription automatique de la parole par l’analyse de l’environnement sonore
        Sébastien FERREIRA – Equipe SAMOVA, IRIT UT3 Paul Sabatier, En visioconférence
        #these
        Mardi 6 Avril 2021, 10h00
        Jusqu’où les goûts musicaux sont ils prédictibles par l’intelligence artificielle ?
        Nicolas DAUBAN – Equipe SAMOVA, IRIT UT3 Paul Sabatier, En visioconférence
        #these
        Lundi 22 Mars 2021, 17h00
        Reconnaissance automatique de la parole à large vocabulaire : des approches hybrides aux approches End-to-End
        Abdelwahab HEBA – Equipe SAMOVA, IRIT UT3 Paul Sabatier, En visioconférence
        #these
        Lundi 25 Mars 2019, 14h30
        Découverte d’unités linguistiques à l’aide de méthodes d’apprentissage non supervisé
        Céline MANENTI – Equipe SAMOVA – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
        #these
        Mercredi 20 Décembre 2017, 10h30
        Apprentissage en ligne de signatures audiovisuelles pour la reconnaissance et le suivi de personnes au sein d’un réseau de capteurs ambiants
        François-Xavier DECROIX – Equipe SAMOVA – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
        #these
        Mercredi 20 Juillet 2016, 10h00
        Synchronisation automatique d’un contenu audiovisuel avec un texte qui le décrit
        Hassan WEHBE – Equipe SAMOVA – IRIT UT3 Paul Sabatier, IRIT, Salle des Thèses
        #these
        Mardi 28 Juin 2016, 14h00
        Segmentation et regroupement en chanteurs. Application aux enregistrements ethnomusicologiques
        Marwa THLITHI – Equipe SAMOVA – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
        #these
        Jeudi 3 Décembre 2015, 10h00
        Perception multimodale de l’homme pour l’interaction homme-robot
        Christophe MOLLARET – Equipe SAMOVA – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
        #these
        Jeudi 9 Janvier 2020 – Vendredi 10 Janvier 2020
        12th Speech In Noise Workshop
        Hôtel-Dieu Saint-Jacques, Toulouse
        #congres En savoir plus
        Lundi 4 Juillet 2016 – Vendredi 8 Juillet 2016
        Journées d’Etudes sur la Parole
        INALCO, 75013 Paris
        #congres En savoir plus
        Jeudi 21 Février 2019, 11h00 – 12h00
        Weakly-supervised approaches for sound event detection
        Thomas PELLEGRINI – Equipe SAMOVA – IRIT (France) INP-ENSEEIHT, Salle des thèses
        #seminaire
        Mercredi 31 Août 2016, 10h00 – 12h00
        Advanced human robot social interaction: goals, challenges and approaches
        Sarah COSENTINO – Waseda University (Japon) UT3 Paul Sabatier, IRIT, Salle des Thèses
        #seminaire
        Lundi 20 Avril 2015, 13h30
        Analyse de signaux multi-composantes: avancées théoriques et applications musicales
        Dominique FOURER UT3 Paul Sabatier, IRIT, Salle des Thèses
        #seminaire
        Lundi 19 Mai 2014, 15h00
        Segmentations sonore et audiovisuelle ?
        Julien PINQUIER – Equipe SAMOVA – IRIT UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
        #hdr
        Jeudi 27 Mai 2021
        Séminaire AFCP — Phonétique Clinique (en remplacement de JPC2021)
        UT3 Paul Sabatier, En visioconférence
        #journee
        Mercredi 4 Septembre 2019 – Vendredi 6 Septembre 2019
        Training Network on Automatic Processing of PAthological Speech (TAPAS) TE3: Data Collection, Management and Ethical Practices
        UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
        #journee
        Jeudi 4 Octobre 2018
        2018 AIRBUS Air Traffic Control Challenge Workshop
        UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
        #journee
        Jeudi 8 Mars 2018
        Traitement automatique de la parole et ressources pour la didactique de l’oral en L2 : variation, corpus, techniques
        UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
        #journee
        Mercredi 4 Octobre 2017
        Workshop Language Didactics, Gestures & CALL
        UT3 Paul Sabatier, IRIT, Auditorium J. Herbrand
        #journee