Responsable : Julien PINQUIER

Les travaux de l’équipe SAMoVA se placent dans le contexte de l’indexation et de la recherche de documents audio et vidéo. Notre recherche s’appuie sur le traitement du signal, la modélisation, ainsi que sur la structuration du contenu audiovisuel.
Compétences
personnel de l’équipe
- Régine ANDRé-OBRECHTProfesseur Emérite – UT3
- Hervé BREDINChargé de Recherche – CNRS
- Jérôme FARINASMaître de Conférences – UT3
- Isabelle FERRANéMaître de Conférences – UT3
- Philippe JOLYProfesseur – UT3
- Julie MAUCLAIRMaître de Conférences – UT3
- Thomas PELLEGRINIMaître de Conférences – UT3
- Julien PINQUIERMaître de Conférences (HDR) – UT3
- Christine SENACMaître de Conférences – UT3
- Ibrahim ABDULLAHStagiaire M2 – UT3
- Louis CASTRES-SAINT-MARTINStagiaire M2 – ENPC
- Benjamin CHAMANDDoctorant – UT3
- Romain CONTRAINIngénieur de Recherche – UT3
- Verdiana DE FINODoctorant – UT3
- Lila GRAVELLIERDoctorant – UT3
- Richard JUDENNEStagiaire M2 – UT3
- Etienne LABBéDoctorant – UT3
- Florent MEYERStagiaire M2 – UT3
- Alexis PLAQUETStagiaire M2 – Autre tutelle
- Sebastiao QUINTASDoctorant – UT3
- Estelle RANDRIADoctorant – UT3
- Vincent ROGERDoctorant – UT3
- Jérome SUSGINStagiaire M2 – UT3
- Robin VAYSSEDoctorant – UT3
- Mathieu BALAGUERIngénieur de Recherche Associé – UT3
- Lucile GELINChercheur Associé – Lalilo
publications de l’équipe
Mathieu Balaguer, Timothy Pommée, Julien Pinquier, Jérôme Farinas, Virginie Woisard, Florence Sordes
Development and preliminary validation of the questionnaire ‘Evaluation of the constitution of social circles (ECSC)’ in patients treated for cancer of the upper aerodigestive tract
Folia Phoniatrica et Logopaedica, Karger, 2022, ⟨10.1159/000525352⟩
Lionel Fontan, Libio Gonçalves Braz, Julien Pinquier, Michael Stone, Christian Füllgrabe
Using Automatic Speech Recognition to Optimize Hearing-Aid Time Constants
Frontiers in Neuroscience, Frontiers, 2022, 16 (779062), ⟨10.3389/fnins.2022.779062⟩
Libio Gonçalves Braz, Lionel Fontan, Julien Pinquier, Michael A Stone, Christian Füllgrabe
OPRA-RS: A Hearing-Aid Fitting Method Based on Automatic Speech Recognition and Random Search
Frontiers in Neuroscience, Frontiers, 2022, 16, pp.779048. ⟨10.3389/fnins.2022.779048⟩
Renée Speyer, Anna-Liisa Sutt, Liza Bergström, Shaheen Hamdy, Timothy Pommée, Mathieu Balaguer, Anett Kaale, Reinie Cordier
Neurostimulation in People with Oropharyngeal Dysphagia
Journal of Clinical Medicine, MDPI, 2022, Special issue : Advances in Management of Voice and Swallowing Disorders, 11 (4), pp.993. ⟨10.3390/jcm11040993⟩
Chems-Eddine Himeur, Thibault Lejemble, Thomas Pellegrini, Mathias Paulin, Loic Barthe, Nicolas Mellado
PCEDNet : A Lightweight Neural Network for Fast and Interactive Edge Detection in 3D Point Clouds
ACM Transactions on Graphics, Association for Computing Machinery, 2022, 41 (1), pp.1-21. ⟨10.1145/3481804⟩
Renée Speyer, Reinie Cordier, Anna-Liisa Sutt, Lianne Remijn, Bas Joris Heijnen, Mathieu Balaguer, Timothy Pommée, Michelle Mcinerney, Liza Bergström
Behavioural Interventions in People with Oropharyngeal Dysphagia
Journal of Clinical Medicine, MDPI, 2022, Special issue, 11 (3), pp.685. ⟨10.3390/jcm11030685⟩
Timothy Pommée, Mathieu Balaguer, Julie Mauclair, Julien Pinquier, Virginie Woisard
Intelligibility and comprehensibility: A Delphi consensus study
International Journal of Language and Communication Disorders, Wiley, 2022, 57 (1), pp.21 – 41. ⟨10.1111/1460-6984.12672⟩
Lucile Gelin, Morgane Daniel, Julien Pinquier, Thomas Pellegrini
End-to-end acoustic modelling for phone recognition of young readers
Speech Communication, Elsevier : North-Holland, 2021, 134, pp.71-84. ⟨10.1016/j.specom.2021.08.003⟩
Renaud Péteri, Georges Quénot, Philippe Joly
Content-based multimedia indexing (CBMI 2018) [SI 1104]
Multimedia Tools and Applications, Springer Verlag, 2021, 80 (15), pp.22321-22322. ⟨10.1007/s11042-020-10502-7⟩
Virginie Woisard, Corine Astésano, Mathieu Balaguer, Jérome Farinas, Corinne Fredouille, Pascal Gaillard, Alain Ghio, Laurence Giusti, Imed Laaridh, Muriel Lalain, Benoit Lepage, Julie Mauclair, Olivier Nocaudie, Julien Pinquier, Gilles Pouchoulin, Michèle Puech, Danièle Robert, Vincent Roger
C2SI corpus: a database of speech disorder productions to assess intelligibility and quality of life in head and neck cancers
Language Resources and Evaluation, Springer Verlag, 2021, 55 (1), pp.173-190. ⟨10.1007/s10579-020-09496-3⟩
Mathieu Balaguer, Timothy Pommée, Jérôme Farinas, Julien Pinquier, Virginie Woisard
Paramètres perceptifs expliquant la sévérité du trouble de parole mesurée automatiquement en cancérologie ORL
Rééducation orthophonique, Ortho édition, 2021, Chapitre : “De l’exploration à la prise en soins de la voix chez l’adulte : données actuelles.. sur la voie des voix”, 286, pp.1-13
Mathieu Balaguer, Josiane Percodani, Virginie Woisard
Le Carcinologic Handicap Index (CHI) : questionnaire d’autoévaluation du handicap à destination des patients traités pour cancer des VADS
Annales françaises d’Oto-rhino-laryngologie et de Pathologie Cervico-faciale, Elsevier, United States, 2017, 134 (6), pp.382-387. ⟨10.1016/j.aforl.2016.07.021⟩
Sylvain Detey, Lionel Fontan, Thomas Pellegrini
Traitement de la prononciation en langue étrangère : approches didactiques, méthodes automatiques et enjeux pour l’apprentissage
Dans : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 57, N. 3, (en ligne), 2016.
Accès : https://www.atala.org/Traitement-de-la-prononciation-en – https://oatao.univ-toulouse.fr/19173/
BibTeXLionel Fontan, Cynthia Magnen, Julien Tardieu, Isabelle Ferrané, Julien Pinquier, Jérôme Farinas, Pascal Gaillard, Xavier Aumont
Comparaison de mesures perceptives et automatiques de l’intelligibilité : application à de la parole simulant la presbyacousie
Dans : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 55, N. 2, p. 151-174, mars 2015.
Résumé Accès : http://www.atala.org/Comparaison-de-mesures-perceptives – https://oatao.univ-toulouse.fr/15274/
BibTeXBlandine Boudet, Thérèse Giacobini, Isabelle Ferrané, Carine Fortin, Christophe Mollaret, Frédéric Lerasle, Pierre Rumeau
Quels sont les objets égarés à domicile par les personnes âgées fragiles ? Une étude pilote sur 60 personnes.
Dans : Neurologie – Psychiatrie – Gériatrie (NPG), Elsevier, Vol. Vol. 14/79, p. 38-42, 2014.
David Janiszek, Damien Pellier, Julie Mauclair, Laetitia Boulc’H, Jean-Louis Baron, Yannick Parchemal
Utilisation de la robotique pédagogique pour enseigner l’intelligence artificielle : une expérience d’approche par projet auprès d’étudiants en informatique.
Dans : Sciences et Technologies de l’Information et de la Communication pour l’Éducation et la Formation (STICEF), Association des Technologies de l’Information pour l’Education et la Formation, Paris, Vol. 18, (en ligne), 2011.
Accès : http://sticef.univ-lemans.fr/num/vol2011/07r-janiszek/sticef_2011_janiszek_07rp.html
BibTeXJérôme Farinas, Jean-Luc Rouas, François Pellegrino, Régine André-Obrecht
Extraction automatique de paramètres prosodiques pour l’identification automatique des langues
Dans : Traitement du Signal, GRETSI : Groupement de Recherche en Traitement du Signal et des Images, Vol. 22, N. 2, p. 81-97, 2005.
Accès : http://documents.irevues.inist.fr/bitstream/handle/2042/2443/02%22Andr%E9-Obrecht+couleur.pdf?sequence=1
BibTeXJulien Pinquier, Jean-Luc Rouas, Régine André-Obrecht
Fusion de paramètres pour une classification automatique parole/musique robuste
Dans : Technique et science informatiques (TSI) : Fusion numérique/symbolique, Hermès, 8, quai du marche neuf, F-75004 Paris, Vol. 22, p. 831-852, 2003.
Régine André-Obrecht, Abdelouafi Meziane, Bruno Jacob
Modélisation de la durée des sons dans un système de reconnaissance automatique de la parole
Dans : Comptes Rendus de l’Académie des Sciences, Académie des Sciences, Elsevier, Paris, Vol. t327 série IIb, p. 379-382, 1999.
Philippe Ercolessi, Christine Senac, Hervé Bredin, Sandrine Mouysset
Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d’histoires
Dans : Revue des Sciences et Technologies de l’Information, Hermès Science, Vol. 15 N. 2, pp. 41-66, 2012.
Ebroul Iquierdo, Jenny Bennois-Pineau, Régine André-Obrecht
Special Issue on Content Based Multimedia Indexing and Retrieval
Dans : Signal Processing: Image Communication, Elsevier, Vol. 22, Issues 7-8, 2007.
Special Issue on Speaker Recognition and its Commercial and Forensic Applications
Dans : International Journal Speech Communication, N.H Elsevier ISSN 0167-6393, North Holland, Vol. 31, Nos 2-3, juin 2000.
Efficient Automatic Analysis of Camera Work and Microsegmentation of Video Using Spatio-Temporal Images
Dans : Signal Processing : Image Communication, Elsevier, Eurasip, Amsterdam, Vol. 8(4), mai 1996.
Verdiana de Fino, Lionel Fontan, Julien Pinquier, Corentin Barcat, Isabelle Ferrané, Sylvain Detey
Mesures automatiques de parole non-native : exploration pilote d’un corpus d’apprenants japonais de français et différenciation de niveaux
34émes Journées d’Études sur la Parole (JEP2022), Jun 2022, Noirmoutier, France. pp.1-10
Mesure de l’altération de la communication par analyses automatiques de la parole spontanée après traitement d’un cancer oral ou oropharyngé : état des lieux et perspectives
34èmes Journées d’Étude sur la Parole (JEP 2022), Jun 2022, Noirmoutier, France
Cédérick Mouliets, Isabelle Ferrané, Heriberto Cuayáhuitl
Reward-Based Environment States for Robot Manipulation Policy Learning
NeurIPS Workshop on Deployable Decision Making in Embodied Systems (DDM 2021), University of Toronto, Dec 2021, Toronto, Canada. pp.1-6
Mathieu Balaguer, Lucile Gelin, Virginie Woisard, Jérôme Farinas, Julien Pinquier
Measurement of speech intelligibility after oral or oropharyngeal cancer by an automatic speech recognition system
12th International Workshop MAVEBA (Models and analysis of vocal emissions for biomedical applications), Università degli Studi Firenze, Dec 2021, Firenze, Italy
Loren Lugosch, Piyush Papreja, Mirco Ravanelli, Abdelwahab Heba, Titouan Parcollet
Timers and Such: A Practical Benchmark for Spoken Language Understanding with Numbers
35th Conference on Neural Information Processing Systems (NeurIPS 2021) Track on Datasets and Benchmarks., Dec 2021, Virtual, Canada. pp.1-11
Lila Gravellier, Julie Hunter, Philippe Muller, Thomas Pellegrini, Isabelle Ferrané
Weakly supervised discourse segmentation for multiparty oral conversations
2021 Conference on Empirical Methods in Natural Language Processing (EMNLP 2021), ACL: Association for Computational Linguistics, Nov 2021, Punta Cana, Dominican Republic. pp.1381-1392
Quentin Portes, Julien Pinquier, Frédéric Lerasle, José Mendes Carvalho
Multimodal human interaction analysis in vehicle cockpit
IEEE International Intelligent Transportation Systems Conference (ITSC 2021), Sep 2021, Indianapolis, United States. pp.2118-2124, ⟨10.1109/ITSC48978.2021.9564792⟩
Quentin Portes, Julien Pinquier, Frédéric Lerasle, Jose Mendes-Carlalho
Analyse multimodale d’interaction humaine dans le cockpit d’un véhicule
18èmes journées francophones des jeunes chercheurs en vision par ordinateur (ORASIS 2021), Centre National de la Recherche Scientifique [CNRS]; Equipe REVA, IRIT : Institut de Recherche en Informatique de Toulouse, Sep 2021, Saint Ferréol, France
Lucile Gelin, Thomas Pellegrini, Julien Pinquier, Morgane Daniel
Simulating reading mistakes for child speech Transformer-based phone recognition
Annual Conference of the International Speech Communication Association (INTERSPEECH), Aug 2021, Brno, Czech Republic
End-to-end speaker segmentation for overlap-aware resegmentation
Interspeech 2021, Aug 2021, Brno, Czech Republic
Accès: https://hal-univ-lemans.archives-ouvertes.fr/hal-03257524
Robin Vaysse, Alain Ghio, Corine Astésano, Jérôme Farinas, François Viallet
Analyse macroscopique des variations et modulations de F0 en lecture dans la maladie de Parkinson : données sur 320 locuteurs
34e Journées d’Études sur la Parole (JEP2022), Association Française de la Communication Parlée, Jun 2022, Noirmoutier, France. A paraître
Vincent Roger, Jérôme Farinas, Virginie Woisard, Julien Pinquier
Création d’une mesure entropique de la parole pour évaluer l’intelligibilité de patients atteints de cancers des voies aérodigestives supérieures
34e Journées d’Études sur la Parole (JEP2022), Association Française de la Communication Parlée, Jun 2022, Noirmoutier, France. A paraître
Evaluation automatique de l’intelligibilité pour des patients présentant une atteinte de la voix
Premier webinaire de Start in Lab Santé 2021, Digital 113, Nov 2021, Toulouse, France
Mathieu Balaguer, Lucile Gelin, Virginie Woisard, Jérôme Farinas, Julien Pinquier
Mesure de l’intelligibilité après cancer oral ou oropharyngé par un système de reconnaissance automatique de la parole
1ère Journée Scientifique d’Orthophonie, SURO Société Universitaire de Recherche en Orthophonie, Oct 2021, Congrès en ligne, France
La laryngophoniatrie du futur
Congrès National de la Société Française d’ORL, 2021, Paris, France
Sébastien Ferreira, Jérome Farinas, Julien Pinquier, Stéphane Rabant
Analyse du bruit pour la prédiction de la qualité de la transcription automatique de la parole
27e Colloque du Groupe de Recherche sur le Traitement du Signal et des Images (GRETSI 2019), Aug 2019, Lille, France. pp.1-4
Julien Pinquier, Jérome Farinas, Xavier de Boissezon, Patrice Peran, Lola Danet, Mélanie Jucla
EVOLEX : apport de la reconnaissance vocale pour le diagnostic des dysfonctionnements cognitifs légers
8e Journees de Phonetique Clinique (JPC 2019), May 2019, Mons, Belgique. pp.105-106
Virginie Woisard, Jérome Farinas, Corine Astesano
Intelligibilité de la parole et qualité de vie. Réflexions à partir des résultats de l’étude «carcinologic speech severity index»
8e Journees de Phonetique Clinique (JPC 2019), May 2019, Mons, Belgique. pp.15-16
Marc Moreaux, Michaël Garcia Ortiz, Isabelle Ferrané, Frédéric Lerasle
Localisation sonore par attention et apprentissage profond semi-supervisé
Congrès Francophone de Reconnaissance des Formes et Intelligence Artificielle (RFIA 2018), Jun 2018, Marne-la-Vallée, France. pp.1-3
Sébastien Ferreira, Jérome Farinas, Julien Pinquier, Stéphane Rabant
Prédiction a priori de la qualité de la transcription automatique de la parole bruitée
32e Journées d’Etudes sur la Parole (JEP 2018), Jun 2018, Aix-En-Provence, France. pp.249-257
Alexandre Boyer, Etienne Sicard
Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC
Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1
Automatic correction of adverb placement errors for CALL
Dans : Eurocall12. G Lund (Eds.) , EUROCALL Association, (support électronique), juillet 2012.
Hervé Bredin, Aurélien Mayoue, Gérard Chollet
Talking-Face Verification
Dans : Guide to Biometric Reference Systems and Performance Evaluation. Dijana Petrovska, Gérard Chollet, Bernadette Dorizzi (Eds.) , Springer, 10, p. 297-326, 2009.
Brice Burger, Isabelle Ferrané, Frédéric Lerasle
Towards multimodal interface for interactive robots: challenges and robotic systems description
Dans : Cutting Edge Robotics 2009. Kordic Vedran (Eds.) , INTECH, (en ligne), août 2009.
Accès : http://intechweb.org/invitations.php?code=4b5cb9fc911b854ff9bd08e5a7ad866f&PHPSESSID=7d013daoo3i48pshqjg610amf7
BibTeXIterated Function Systems and some generalizations: Local Regularity Analysis and Multifractal Modeling of Signals
Dans : Scaling Laws, Fractals and Wavelets. Patrice Abry, Paulo Gonçalves, Jacques Lévy Véhel (Eds.) , ISTE – WILEY, p. 301-332, janvier 2009.
Gérard Chollet, Rémi Landais, Thomas Hueber, Hervé Bredin, Chafic Mokbel, Patrick Perrot, Leila Zouari
Some Experiments in Audio-Visual Speech Processing
Dans : Advances in Nonlinear Speech Processing. Mohamed Chetouani (Eds.) , Springer-Verlag, p. 28-56, Vol. 4885/2007, LNCS, 2007.
Bouchra Abboud, Hervé Bredin, Guido Aversano , Gérard Chollet
Audio-visual Identity Verification: An Introductory Overview
Dans : Progress in Nonlinear Speech Processing. Yannis Stylianou, Marcos Faundez-Zanuy, Anna Eposito (Eds.) , Springer-Verlag, p. 118-134, Vol. 4391/2007, LNCS, 2007.
Descriptions des séquences d’images
Dans : L’indexation multimédia Description et recherche automatiques. P. Gros (Eds.) , Hermès, p. 119-136, Traité IC2, série Traitement du signal et de l’image, mai 2007.
Jorge Gutierrez, Jean-Luc Rouas, Régine André-Obrecht
Application of uncertainty-based methods to fuse language identification expert decision
Dans : Modern Information Processing: From Theory to Application (Selected Papers of the IPMU’2004). B. Bouchon-Meunier, G. Coletti, R.R. Yager (Eds.) , Elsevier, p. 255-268, 2006.
Farah Benamara, Véronique Moriceau
Prepositions in Cooperative Question-Answering Systems: a Preliminary Analysis
Dans : Syntax and semantics of prepositions. Patrick Saint-Dizier (Eds.) , Springer, p. 307-330, Vol. 29, Text, Speech and Language Technology, novembre 2006.
Accès : http://www.springerlink.com/content/978-1-4020-3873-0
BibTeXEnjeux d’une normalisation pour l’indexation des contenus multimédia
Dans : Paradigmes et enjeux de l’informatique. N Bidoit, L Fariñas del Cerro, S Fdida, B Vallée (Eds.) , Hermès Science, p. 157-169, Informatique et Systèmes d’Information, février 2005.
Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes
Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30031⟩
Apprentissage profond faiblement supervisé et semi-supervisé pour la détection d’évènements sonores
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30262⟩
Mesure de l’altération de la communication par analyses automatiques de la parole spontanée après traitement d’un cancer oral ou oropharyngé
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30109⟩
Jusqu’où les goûts musicaux sont-ils prédictibles par l’intelligence artificielle ?
Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30082⟩
Reconnaissance automatique de la parole à large vocabulaire : des approches hybrides aux approches End-to-End
Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30116⟩
Reconnaissance automatique de la parole à large vocabulaire : des approches hybrides aux approches End-to-End
Son [cs.SD]. Université toulouse 3 Paul Sabatier, 2021. Français
Instantiation of a textual description schema of video surveillance scenes
Image Processing [eess.IV]. Université Paul Sabatier – Toulouse III, 2019. English. ⟨NNT : 2019TOU30249⟩
Apprentissage en ligne de signatures audiovisuelles pour la reconnaissance et le suivi de personnes au sein d’un réseau de capteurs ambiants
Acoustique [physics.class-ph]. Université Paul Sabatier – Toulouse III, 2017. Français. ⟨NNT : 2017TOU30298⟩
Synchronisation automatique d’un contenu audio-visuel avec un texte qui le décrit
Thèse de doctorat, Université de Toulouse, juillet 2016.
Résumé Accès : http://thesesups.ups-tlse.fr/3224/1/2016TOU30104.pdf
BibTeXSegmentation et regroupement en chanteurs. Application aux enregistrements ethnomusicologiques
Thèse de doctorat, Université Paul Sabatier, juin 2016.
Perception multimodale de l’homme pour l’Interaction Homme-Robot
Thèse de doctorat, Université Paul Sabatier, décembre 2015.
Segmentations sonore et audiovisuelle ?
Habilitation à diriger des recherches, Université Paul Sabatier, mai 2014.
Accès : http://www.irit.fr/~Julien.Pinquier/Docs/HDR_Pinquier.pdf
BibTeXSpectre de rythme et sources multiples : au coeur des contenus ethnomusicologiques et sonores
Thèse de doctorat, Université des Sciences Sociales, juillet 2014.
Résumé Accès : http://publications.ut-capitole.fr/16314/1/LeCozMaxime-2014.pdf
BibTeXCaractérisation et reconnaissance de sons d’eau pour le suivi des activités de la vie quotidienne. Une approche fondée sur le signal, l’acoustique et la perception.
Thèse de doctorat, Université Paul Sabatier, mars 2014.
Extraction multimodale de la structure narrative des épisodes de séries télévisées
Thèse de doctorat, Université de Toulouse, septembre 2013.
Masquage de pertes de paquets en voix sur IP
Thèse de doctorat, Institut National Polytechnique de Toulouse, janvier 2011.
Résumé Accès : http://ethesis.inp-toulouse.fr/archive/00001455/
BibTeXRecherche du rôle des intervenants et de leurs interactions pour la structuration de documents audiovisuels
Thèse de doctorat, Université Paul Sabatier, juillet 2011.
Résumé Accès : http://tel.archives-ouvertes.fr/tel-00632119/fr/ – http://www.irit.fr/publis/SAMOVA/TH/manuscritTheseBigot2011.pdf
BibTeXUnsupervised Video Indexing based on Audiovisual Characterization of Persons
Thèse de doctorat, Université de Toulouse, juin 2010.
Accès : http://tel.archives-ouvertes.fr/docs/00/51/54/74/PDF/TheseElie.pdf
BibTeX
Etienne Sicard, Anne Menin-Sicard
La diadococinésie et son application en orthophonique clinique
[Rapport de recherche] insa toulouse. 2020
Etienne Sicard, Anne Menin-Sicard
Analyse de la qualité des phrases pour un bilan objectif de la parole
[Rapport de recherche] INSA Toulouse. 2019
Thomas Pellegrini, Céline Manenti, Julien Pinquier
The IRIT-UPS system @ ZeroSpeech 2017
[Research Report] IRIT. 2017
Maëlys Salingre, Jérôme Farinas, Stéphane Rabant
Automatic identification of French regional accent
[Rapport de recherche] IRIT. 2017
Recherche des expressions clés caractéristiques de linteraction entre locuteurs dans les documents audiovisuels
Rapport de Master, Université Paul Sabatier, juin 2011.
Résumé Accès : http://www.irit.fr/publis/SAMOVA/M2R/Memoire_M2R_ArchangeDestine.pdf
BibTeXIndexation en intervenant d’un document vidéo par identification du visage
Rapport de Master, Université Paul Sabatier, juin 2007.
Accès : http://www.irit.fr/publis/SAMOVA/Memoire_M2R_Noureddine.pdf
BibTeXDescription de comportements humains et interrogation.
Rapport de Master, Université de Toulouse, juin 2006.
Accès : http://www.phdgroup.org/ul-stsi-2005-2006.php
BibTeXCaractérisation de la voix chantée
Rapport de Master, Institut National Polytechnique de Toulouse, juin 2006.
Application des matrices de similarité à la comparaison de contenus sonores
Rapport de Master, Université Paul Sabatier, juin 2006.
Segmentation et regroupement en locuteurs d’un document sonore
Rapport de Master, Université Paul Sabatier, juin 2006.
Caractérisation d’un intervenant dans un document audiovisuel
Rapport de stage, Master Recherche 2IH, Université Paul Sabatier, juin 2005.
Etude constractive de décodeurs acoustico-phonétique
Rapport de stage, Master Recherche 2IH, Université Paul Sabatier, juin 2005.
Contribution à l’indexation multimedia
Rapport de recherche, IRIT/2005-8-R, IRIT, mars 2005.
Méthodes à vecteurs de support et indexation sonore
Rapport de stage, DEA IIL, Université Paul Sabatier, 2004.
contrats de l’équipe
Acronyme | Titre | Resp. sc | Début – fin | |
---|---|---|---|---|
VOICE4PD – MSA | ![]() | Diagnostic différentiel entre la maladie de Parkinson et latrophie multisystématisée par analyse numérique de la parole | Julie MAUCLAIR | 2016 – 2023 |
RUGBI | ![]() | Recherche d’unités linguistiques pertinentes pour améliorer la mesure de l’intelligibilité de la parole altérée par des troubles de production pathologique | Jérôme FARINAS | 2018 – 2023 |
ALAIA | ![]() | Apprentissage des Langues Assisté par Intelligence Artificielle | Isabelle FERRANé | 2019 – 2022 |
PhLEs-NID | Dispositif non invasif evaluant l’éfficacité pharyngo-laryngée | Jérôme FARINAS | 2022 – 2026 | |
LUDAU [Contrat terminé] | ![]() | Découverte peu et non-supervisée d’unités audio à l’aide d’apprentissage profond | Thomas PELLEGRINI | 2018 – 2022 |
CIESS [Contrat terminé] | CIESS : Contribution, indexation, et enrichissement d’un corpus de sons de l’environnement | Régine ANDRé-OBRECHT | 2013 – 2016 | |
DIADEMS [Contrat terminé] | Description, Indexation, Accés aux Documents Ethnomusicologiques et Sonores | Régine ANDRé-OBRECHT | 2013 – 2016 | |
RIDDLE [Contrat terminé] | Robots perceptuels et interactifs dédiés aux environnement quotidiens | Isabelle FERRANé | 2012 – 2015 | |
ARTIS [Contrat terminé] | ![]() | Inversion articulatoire de la parole audiovisuelle pour la parole augmentée | Régine ANDRé-OBRECHT | 2009 – 2013 |
IMMED [Contrat terminé] | ![]() | Indexation de données multimédia embarquées pour le diagnostic et le traitement des démences | Julien PINQUIER | 2009 – 2012 |
Acronyme | Titre | Resp. sc | Début – fin | |
---|---|---|---|---|
TAPAS | ![]() | Training Network on Automatic Processing of PAthological Speech | Julie MAUCLAIR | 2017 – 2022 |
VICTORIA [Contrat terminé] | ![]() | Video analysis for Investigation of Criminal and TerrORIst Activities | Philippe JOLY | 2017 – 2020 |
Acronyme | Titre | Resp. sc | Début – fin | |
---|---|---|---|---|
AUDIOCAP [Contrat terminé] | Audition et handicap dans le bruit vers la restauration de lintelligibilité de la parole | Julien PINQUIER | 2019 – 2021 | |
EVOLEX2 [Contrat terminé] | Apport de la reconnaissance vocale pour le diagnostic de dysfonctionnements cognitifs légers | Julien PINQUIER | 2019 – 2021 | |
INGPRO [Contrat terminé] | Incidence des gestes sur la prononciation | Isabelle FERRANé | 2019 – 2021 | |
SAMI [Contrat terminé] | Système automatisé de mesure de lintelligibilité | Julien PINQUIER | 2018 – 2021 | |
ECREME [Contrat terminé] | Expertises Musicale et Cognitive pour Recommandation Musicale personnaliséE | Julien PINQUIER | 2017 – 2020 | |
Mesure de compréhenion de la parole [Contrat terminé] | Mesure de compréhension de la parole : équipement électronique intelligent de mesure de la compréhension de la parole basée sur une approche cognitive sur l’exemple de la compréhension humaine | Jérôme FARINAS | 2012 – 2015 |