Responsable : Julien PINQUIER

Les travaux de l’équipe SAMoVA se placent dans le contexte de l’indexation et de la recherche de documents audio et vidéo. Notre recherche s’appuie sur le traitement du signal, la modélisation, ainsi que sur la structuration du contenu audiovisuel.
Compétences
personnel de l’équipe
- Régine ANDRÉ-OBRECHTProfesseur Emérite (HDR) – UT3
- Hervé BREDINChargé de Recherche – CNRS
- Jérôme FARINASMaître de Conférences – UT3
- Isabelle FERRANÉMaître de Conférences – UT3
- Philippe JOLYProfesseur – UT3
- Julie MAUCLAIRMaître de Conférences – UT3
- Thomas PELLEGRINIMaître de Conférences – UT3
- Julien PINQUIERMaître de Conférences (HDR) – UT3
- Christine SENACMaître de Conférences – UT3
- Ilham AIT BRAHIMIngénieur d’Etudes – TTT
- Philippe ALLETStagiaire M2 – Toulouse INP (co-encadrement APO)
- Mathieu BALAGUERIngénieur de Recherche – UT3
- Jean BAQUÉStagiaire M2 – Médecine
- Séverin BAROUDIStagiaire M2 – UT3
- Benjamin CHAMANDDoctorant – UT3
- Romain CONTRAINIngénieur de Recherche – UT3
- Matéo COUSINStagiaire M1 – UT3
- Verdiana DE FINODoctorant – UT3
- Elies EL AOUDIngénieur de Recherche – TTT
- Mohamed GHARBIStagiaire M1 – UT3
- Lila GRAVELLIERDoctorant – UT3
- Etienne LABBÉDoctorant – UT3
- Maxime MBOUI-NTAMACKStagiaire M1 – UT3
- Clément PAGESStagiaire M2 – UPSITECH
- Jim PETIOTIngénieur d’Etudes – UT3
- Pierre PINCONStagiaire M1 – UT3
- Alexis PLAQUETDoctorant – UT3
- Sebastiao QUINTASChercheur Contractuel – UT3
- Robin VAYSSEIngénieur de Recherche – TTT
- Arthur VIGOUROUXStagiaire M1 – CNRS
- Wenxiang ZHOUStagiaire M2 – UT3
- Lucile GELINChercheur Associé – Lalilo
- Joonas KALDAStagiaire doctoral – Tallinn University of Technology
publications de l’équipe
Christophe Mollaret, Alhayat Ali Mekonnen, Frédéric Lerasle, Isabelle Ferrané, Julien Pinquier, Blandine Boudet, Pierre Rumeau
A Multi-modal Perception based Assistive Robotic System for the Elderly
Dans : Computer Vision and Image Understanding, Elsevier, Vol. 149, p. 78-97, août 2016.
Résumé Accès : http://doi.org/10.1016/j.cviu.2016.03.003 – https://oatao.univ-toulouse.fr/22026/
BibTeXHassan Wehbe, Bassem Haidar, Philippe Joly
Action boundaries detection in a video
Dans : Multimedia Tools and Applications, Springer-Verlag, Heidelberg, Allemagne, Vol. 75 N. 14, p. 8239-8266, août 2015.
Thomas Pellegrini, Lionel Fontan, Julie Mauclair, Jérôme Farinas, Charlotte Alazard-Guiu, Marina Robert, Peggy Gatignol
Automatic Assessment of Speech Capability Loss in Disordered Speech
Dans : ACM Transactions on Accessible Computing (TACCESS), ACM : Association for Computing Machinery, New York, États-Unis, Numéro spécial Special Issue on Speech and Language Processing for AT (Part 1), Vol. 6 N. 3, (en ligne), mai 2015.
Résumé Accès : http://dl.acm.org/citation.cfm?id=2739051&CFID=676049914&CFTOKEN=44234635 – https://oatao.univ-toulouse.fr/15312/
BibTeXElie El Khoury, Christine Senac, Philippe Joly
Audiovisual diarization of people in video content
Dans : Multimedia Tools and Applications, Springer-Verlag, Heidelberg, Allemagne, Vol. 68, p. 747-775, février 2014.
Accès : http://link.springer.com/article/10.1007%2Fs11042-012-1080-6
BibTeXAbdelkader Guerid, Amrane Houacine, Régine André-Obrecht, Hélène Lachambre
Performance of new voice conversion systems based on GMM models and applied to Arabic language
Dans : International Journal of Speech Technology, Springer, Vol. 15 N. 4, p. 477-485, décembre 2012.
Svebor Karaman, Jenny Benois-Pineau, Vladislavs Dovgalecs, Rémi Megret, Julien Pinquier, Régine André-Obrecht, Yann Gaestel, Jean-François Dartigues
Hierarchical Hidden Markov Model in Detecting Activities of Daily Living in Wearable Videos for Studies of Dementia
Dans : Multimedia Tools and Applications, Springer-Verlag, Heidelberg, Allemagne, Vol. 69, p. 743-771, 2012.
Brice Burger, Isabelle Ferrané, Frédéric Lerasle, Guillaume Infantes
Two-handed Gesture Recognition and Fusion with Speech to command a Robot
Dans : Autonomous Robots, Springer, Vol. AURO655.3, (en ligne), 2012.
Benjamin Bigot, Julien Pinquier, Isabelle Ferrané, Régine André-Obrecht
Detecting individual role using features extracted from speaker diarization results
Dans : Multimedia Tools and Applications, Springer-Verlag, Heidelberg, Allemagne, Vol. 60 N. 2, p. 347-369, septembre 2012.
Résumé Accès : http://dx.doi.org/10.1007/s11042-010-0609-9
BibTeXMark Kane, Julie Mauclair, Julie Berndsen
Automatic Identification of Phonetic Similarity based on Underspecification
Dans : Lecture Notes in Artificial Intelligence (LNAI), Springer-Verlag, Heidelberg, Allemagne, Vol. 6562, p. 47-58, 2011.
Accès : https://link.springer.com/chapter/10.1007%2F978-3-642-20095-3_5
BibTeXZein Al Abidin Ibrahim, Isabelle Ferrané, Philippe Joly
A Similarity-Based Approach for Audiovisual Document Classification Using Temporal Relation Analysis
Dans : EURASIP Journal on Image and Video Processing, EURASIP, Vol. 2011, (en ligne), mars 2011.
Accès : http://jivp.eurasipjournals.com/content/pdf/1687-5281-2011-537372.pdf
BibTeX
Sylvain Detey, Lionel Fontan, Thomas Pellegrini
Traitement de la prononciation en langue étrangère : approches didactiques, méthodes automatiques et enjeux pour l’apprentissage
Dans : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 57, N. 3, (en ligne), 2016.
Accès : https://www.atala.org/Traitement-de-la-prononciation-en – https://oatao.univ-toulouse.fr/19173/
BibTeXLionel Fontan, Cynthia Magnen, Julien Tardieu, Isabelle Ferrané, Julien Pinquier, Jérôme Farinas, Pascal Gaillard, Xavier Aumont
Comparaison de mesures perceptives et automatiques de l’intelligibilité : application à de la parole simulant la presbyacousie
Dans : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 55, N. 2, p. 151-174, mars 2015.
Résumé Accès : http://www.atala.org/Comparaison-de-mesures-perceptives – https://oatao.univ-toulouse.fr/15274/
BibTeXBlandine Boudet, Thérèse Giacobini, Isabelle Ferrané, Carine Fortin, Christophe Mollaret, Frédéric Lerasle, Pierre Rumeau
Quels sont les objets égarés à domicile par les personnes âgées fragiles ? Une étude pilote sur 60 personnes.
Dans : Neurologie – Psychiatrie – Gériatrie (NPG), Elsevier, Vol. Vol. 14/79, p. 38-42, 2014.
David Janiszek, Damien Pellier, Julie Mauclair, Laetitia Boulc’H, Jean-Louis Baron, Yannick Parchemal
Utilisation de la robotique pédagogique pour enseigner l’intelligence artificielle : une expérience d’approche par projet auprès d’étudiants en informatique.
Dans : Sciences et Technologies de l’Information et de la Communication pour l’Éducation et la Formation (STICEF), Association des Technologies de l’Information pour l’Education et la Formation, Paris, Vol. 18, (en ligne), 2011.
Accès : http://sticef.univ-lemans.fr/num/vol2011/07r-janiszek/sticef_2011_janiszek_07rp.html
BibTeXJérôme Farinas, Jean-Luc Rouas, François Pellegrino, Régine André-Obrecht
Extraction automatique de paramètres prosodiques pour l’identification automatique des langues
Dans : Traitement du Signal, GRETSI : Groupement de Recherche en Traitement du Signal et des Images, Vol. 22, N. 2, p. 81-97, 2005.
Accès : http://documents.irevues.inist.fr/bitstream/handle/2042/2443/02%22Andr%E9-Obrecht+couleur.pdf?sequence=1
BibTeXJulien Pinquier, Jean-Luc Rouas, Régine André-Obrecht
Fusion de paramètres pour une classification automatique parole/musique robuste
Dans : Technique et science informatiques (TSI) : Fusion numérique/symbolique, Hermès, 8, quai du marche neuf, F-75004 Paris, Vol. 22, p. 831-852, 2003.
Régine André-Obrecht, Abdelouafi Meziane, Bruno Jacob
Modélisation de la durée des sons dans un système de reconnaissance automatique de la parole
Dans : Comptes Rendus de l’Académie des Sciences, Académie des Sciences, Elsevier, Paris, Vol. t327 série IIb, p. 379-382, 1999.
Philippe Ercolessi, Christine Senac, Hervé Bredin, Sandrine Mouysset
Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d’histoires
Dans : Revue des Sciences et Technologies de l’Information, Hermès Science, Vol. 15 N. 2, pp. 41-66, 2012.
Ebroul Iquierdo, Jenny Bennois-Pineau, Régine André-Obrecht
Special Issue on Content Based Multimedia Indexing and Retrieval
Dans : Signal Processing: Image Communication, Elsevier, Vol. 22, Issues 7-8, 2007.
Special Issue on Speaker Recognition and its Commercial and Forensic Applications
Dans : International Journal Speech Communication, N.H Elsevier ISSN 0167-6393, North Holland, Vol. 31, Nos 2-3, juin 2000.
Efficient Automatic Analysis of Camera Work and Microsegmentation of Video Using Spatio-Temporal Images
Dans : Signal Processing : Image Communication, Elsevier, Eurasip, Amsterdam, Vol. 8(4), mai 1996.
Wael Youssef, Siba Haidar, Philippe Joly
Classifying Deformable and Non-deformable Video Objects (regular paper)
Dans : International Conference on Imaging for Crime Detection and Prevention (ICDP 2016), Madrid, 23/11/16-25/11/16, IET : Institution of Engineering and Technology, (support électronique), novembre 2016.
Résumé Accès : https://doi.org/10.1049/ic.2016.0077 – https://oatao.univ-toulouse.fr/26146/
BibTeXMarwa Thlithi, Julien Pinquier, Thomas Pellegrini, Régine André-Obrecht
Filterbank coefficients selection for segmentation in singer turns (regular paper)
Dans : International Workshop on Content-Based Multimedia Indexing (CBMI 2016), Bucharest, Romania, 15/06/16-17/06/16, IEEE : Institute of Electrical and Electronics Engineers, p. 1-6, juin 2016.
François-Xavier Decroix, Julien Pinquier, Isabelle Ferrané, Frédéric Lerasle
Online Audiovisual Signature Training for Person Re-identification (regular paper)
Dans : International Conference on Distributed Smart Camera (ICDSC 2016), Paris, 12/09/16-15/09/16, ACM : Association for Computing Machinery, p. 62-68, septembre 2016.
Patrice Guyot, Alice Eldridge, Ying Chen Eyre-Walker, Alison Johnston, Thomas Pellegrini, Mika Peck
Sinusoidal modelling for ecoacoustics (regular paper)
Dans : Conference of the International Speech Communication Association (INTERSPEECH 2016), San Francisco, 08/09/16-12/09/16, International Society for Computers and their Applications (ISCA), p. 2602-2606, septembre 2016.
Thomas Pellegrini, Sandrine Mouysset
Inferring phonemic classes from CNN activation maps using clustering techniques (regular paper)
Dans : Conference of the International Speech Communication Association (INTERSPEECH 2016), San Francisco, 09/09/16-12/09/16, International Society for Computers and their Applications (ISCA), p. 1290-1294, septembre 2016.
Etienne Sicard, Anne Menin-Sicard, Stéphanie Perrière, Julie Mauclair
Voice and Speech therapy using VOCALAB – From research to practice (regular paper)
Dans : Spanish International Interdisciplinary Voice Congress, Madrid, Espagne, 25/11/16-26/11/16, Spanish Institute of Voice, (support électronique), novembre 2016.
Vincent Laborde, Thomas Pellegrini, Lionel Fontan, Julie Mauclair, Halima Sahraoui, Jérôme Farinas
Pronunciation assessment of Japanese learners of French with GOP scores and phonetic information (regular paper)
Dans : Conference of the International Speech Communication Association (INTERSPEECH 2016), San Francisco, CA, 08/09/16-12/09/16, ISCA : International Speech Communication Association, p. 2686-2690, septembre 2016.
Résumé Accès : http://dx.doi.org/10.21437/Interspeech.2016-513 – https://oatao.univ-toulouse.fr/17159/
BibTeXLionel Fontan, Isabelle Ferrané, Jérôme Farinas, Julien Pinquier, Xavier Aumont
Using Phonologically Weighted Levenshtein Distances for the Prediction of Microscopic Intelligibility (regular paper)
Dans : Conference of the International Speech Communication Association (INTERSPEECH 2016), San Francisco, CA, 08/09/16-12/09/16, ISCA : International Speech Communication Association, p. 650-654, 2016.
Résumé Accès : http://dx.doi.org/10.21437/Interspeech.2016-431 – https://oatao.univ-toulouse.fr/17158/
BibTeXCéline Manenti, Thomas Pellegrini, Julien Pinquier
CNN-based phone segmentation experiments in a less-represented language (regular paper)
Dans : Conference of the International Speech Communication Association (INTERSPEECH 2016), San Francisco, 09/09/16-12/09/16, ISCA : International Speech Communication Association, p. 3549, septembre 2016.
Résumé Accès : http://dx.doi.org/10.21437/Interspeech.2016-796 – https://oatao.univ-toulouse.fr/17052/
BibTeXChristophe Mollaret, Alhayat Ali Mekonnen, Julien Pinquier, Frédéric Lerasle, Isabelle Ferrané
A Multi-modal Perception based Architecture for a Non-intrusive Domestic Assistant Robot, (regular paper)
Dans : ACM/IEEE International Conference on Human-Robot Interaction (HRI 2016), New Zeland, 07/03/16-10/03/16, ACM : Association for Computing Machinery, p. 481-482, mars 2016.
Accès : https://hal.archives-ouvertes.fr/hal-01296633
BibTeX
IRIT, un acteur de la recherche en Santé et Autonomie, Axe stratégique “Systèmes Informatiques pour la Santé et l’Autonomie”, composante gestion de données
Dans : Université d’été de la e-santé, Castres, France, 05/07/16 (conférencier invité).
La parole « non-standard » : un défi pour les outils de traitement automatique de la parole
Dans : Journée d’étude Regards Croisés sur la Voix, Strasbourg, 10/06/16.
Accès : https://www.irit.fr/~Thomas.Pellegrini/pdf/slides_Pellegrini_strasbourg_Juin2016.pdf
BibTeXLionel Fontan, Thomas Pellegrini, Jérôme Farinas, Julie Mauclair, Vincent Laborde, Halima Sahraoui, Xavier Aumont, Júlia Olcoz, Alberto Abad
Vers des outils automatiques pour l’évaluation de locuteurs atypiques
Dans : Colloque Interphonologie du Français Contemporain Evaluation de la parole non native et corpus oraux, Paris, 08/12/15.
Accès : http://cblle.tufs.ac.jp/ipfc/assets/files/IPFC2015-Paris/IPFC2015_Fontan%20et%20al.pdf
BibTeXThomas Pellegrini, Lionel Fontan
Utilisation d’algorithmes de Goodness of Pronunciation pour l’évaluation de la compréhensibilité de la parole pathologique
Dans : 6èmes Journées de Phonétique Clinique, Montpellier, 29/06/15-01/07/15.
Blandine Boudet, Carine Fortin, Thérèse Giacobini, Christophe Mollaret, Isabelle Ferrané, Frédéric Lerasle, Pierre Rumeau
Etude pilote des objets recherchés sur une population de 60 personnes âgées ambulatoires – poster
Dans : 33èmes journées annuelles de la société française de gériatrie et gérontologie, Paris, 08/10/13-10/10/13.
Sebastian Schmiedeke, Christoph Kofler, Isabelle Ferrané
Overview of MediaEval 2012 Genre Tagging Task
Dans : MediaEval 2012 Workshop, Pisa, Italy, 04/10/12-05/10/12.
Accès : http://ceur-ws.org/Vol-927/mediaeval2012_submission_2.pdf
BibTeXPatrice Guyot, Julien Pinquier
Reconnaissance automatique de sons d’eau, une approche acoustique et perceptive (poster)
Dans : Journées Jeunes Chercheurs en Audition, Acoustique musicale et Signal audio (JJCAAS), LMA, Marseille, 05/12/12-07/12/12.
Patrice Guyot, Julien Pinquier, Olivier Houix, Nicolas Misdariis, Patrick Susini
Reconnaissance automatique et catégorisation perceptive de sons liquides (poster)
Dans : Deuxièmes Journées Perception Sonore, LMA, Marseille, 10/12/12-11/12/12.
Patrice Guyot, Julien Pinquier
Reconnaissance automatique de sons environnementaux (poster)
Dans : Journées Jeunes Chercheurs en Audition, Acoustique musicale et Signal audio (JJCAAS), Orange Labs, Rennes, 07/12/11-09/12/11.
Philippe Ercolessi, Christine Senac, Hervé Bredin, Philippe Joly
Summarizing Video Collection using Semantic Graph
Dans : Workshop IRIT/Kyushu Image et Multimedia, Toulouse – France, 24/11/11-25/11/11.
Accès : http://www.irit.fr/publis/SAMOVA/ercolessiWorkshop2011.pdf
BibTeX
Etienne Sicard, Anne Menin-Sicard, Marie Daumet, Stéphanie Perriere, Océane Barbera
Evaluation de la voix avant/après suivi orthophonique -à propos de la méthodologie d’évaluation et de la fiabilité des mesures chiffrées
Ortho Editions. Efficacité des thérapies, Ortho Editions, pp.233-264, 2017, 978-2-36235-100-6
Alexandre Boyer, Etienne Sicard
Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC
Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1
Automatic correction of adverb placement errors for CALL
Dans : Eurocall12. G Lund (Eds.) , EUROCALL Association, (support électronique), juillet 2012.
Hervé Bredin, Aurélien Mayoue, Gérard Chollet
Talking-Face Verification
Dans : Guide to Biometric Reference Systems and Performance Evaluation. Dijana Petrovska, Gérard Chollet, Bernadette Dorizzi (Eds.) , Springer, 10, p. 297-326, 2009.
Brice Burger, Isabelle Ferrané, Frédéric Lerasle
Towards multimodal interface for interactive robots: challenges and robotic systems description
Dans : Cutting Edge Robotics 2009. Kordic Vedran (Eds.) , INTECH, (en ligne), août 2009.
Accès : http://intechweb.org/invitations.php?code=4b5cb9fc911b854ff9bd08e5a7ad866f&PHPSESSID=7d013daoo3i48pshqjg610amf7
BibTeXIterated Function Systems and some generalizations: Local Regularity Analysis and Multifractal Modeling of Signals
Dans : Scaling Laws, Fractals and Wavelets. Patrice Abry, Paulo Gonçalves, Jacques Lévy Véhel (Eds.) , ISTE – WILEY, p. 301-332, janvier 2009.
Gérard Chollet, Rémi Landais, Thomas Hueber, Hervé Bredin, Chafic Mokbel, Patrick Perrot, Leila Zouari
Some Experiments in Audio-Visual Speech Processing
Dans : Advances in Nonlinear Speech Processing. Mohamed Chetouani (Eds.) , Springer-Verlag, p. 28-56, Vol. 4885/2007, LNCS, 2007.
Bouchra Abboud, Hervé Bredin, Guido Aversano , Gérard Chollet
Audio-visual Identity Verification: An Introductory Overview
Dans : Progress in Nonlinear Speech Processing. Yannis Stylianou, Marcos Faundez-Zanuy, Anna Eposito (Eds.) , Springer-Verlag, p. 118-134, Vol. 4391/2007, LNCS, 2007.
Descriptions des séquences d’images
Dans : L’indexation multimédia Description et recherche automatiques. P. Gros (Eds.) , Hermès, p. 119-136, Traité IC2, série Traitement du signal et de l’image, mai 2007.
Jorge Gutierrez, Jean-Luc Rouas, Régine André-Obrecht
Application of uncertainty-based methods to fuse language identification expert decision
Dans : Modern Information Processing: From Theory to Application (Selected Papers of the IPMU’2004). B. Bouchon-Meunier, G. Coletti, R.R. Yager (Eds.) , Elsevier, p. 255-268, 2006.
Farah Benamara, Véronique Moriceau
Prepositions in Cooperative Question-Answering Systems: a Preliminary Analysis
Dans : Syntax and semantics of prepositions. Patrick Saint-Dizier (Eds.) , Springer, p. 307-330, Vol. 29, Text, Speech and Language Technology, novembre 2006.
Accès : http://www.springerlink.com/content/978-1-4020-3873-0
BibTeXEnjeux d’une normalisation pour l’indexation des contenus multimédia
Dans : Paradigmes et enjeux de l’informatique. N Bidoit, L Fariñas del Cerro, S Fdida, B Vallée (Eds.) , Hermès Science, p. 157-169, Informatique et Systèmes d’Information, février 2005.
Deep learning approaches to assess speech intelligibility of head and neck cancer
Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30272⟩
Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?
Informatique [cs]. Université Paul Sabatier (Toulouse 3), 2022. Français. ⟨NNT : 2022TOU30258⟩
Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond : d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique
Apprentissage [cs.LG]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30180⟩
Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes
Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30031⟩
Apprentissage profond faiblement supervisé et semi-supervisé pour la détection d’évènements sonores
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30262⟩
Mesure de l’altération de la communication par analyses automatiques de la parole spontanée après traitement d’un cancer oral ou oropharyngé
Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30109⟩
Jusqu’où les goûts musicaux sont-ils prédictibles par l’intelligence artificielle ?
Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30082⟩
Reconnaissance automatique de la parole à large vocabulaire : des approches hybrides aux approches End-to-End
Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30116⟩
Reconnaissance automatique de la parole à large vocabulaire : des approches hybrides aux approches End-to-End
Son [cs.SD]. Université toulouse 3 Paul Sabatier, 2021. Français. ⟨NNT : ⟩
Instantiation of a textual description schema of video surveillance scenes
Image Processing [eess.IV]. Université Paul Sabatier – Toulouse III, 2019. English. ⟨NNT : 2019TOU30249⟩
Recherche des expressions clés caractéristiques de linteraction entre locuteurs dans les documents audiovisuels
Rapport de Master, Université Paul Sabatier, juin 2011.
Résumé Accès : http://www.irit.fr/publis/SAMOVA/M2R/Memoire_M2R_ArchangeDestine.pdf
BibTeXIndexation en intervenant d’un document vidéo par identification du visage
Rapport de Master, Université Paul Sabatier, juin 2007.
Accès : http://www.irit.fr/publis/SAMOVA/Memoire_M2R_Noureddine.pdf
BibTeXDescription de comportements humains et interrogation.
Rapport de Master, Université de Toulouse, juin 2006.
Accès : http://www.phdgroup.org/ul-stsi-2005-2006.php
BibTeXCaractérisation de la voix chantée
Rapport de Master, Institut National Polytechnique de Toulouse, juin 2006.
Application des matrices de similarité à la comparaison de contenus sonores
Rapport de Master, Université Paul Sabatier, juin 2006.
Segmentation et regroupement en locuteurs d’un document sonore
Rapport de Master, Université Paul Sabatier, juin 2006.
Caractérisation d’un intervenant dans un document audiovisuel
Rapport de stage, Master Recherche 2IH, Université Paul Sabatier, juin 2005.
Etude constractive de décodeurs acoustico-phonétique
Rapport de stage, Master Recherche 2IH, Université Paul Sabatier, juin 2005.
Contribution à l’indexation multimedia
Rapport de recherche, IRIT/2005-8-R, IRIT, mars 2005.
Méthodes à vecteurs de support et indexation sonore
Rapport de stage, DEA IIL, Université Paul Sabatier, 2004.
contrats de l’équipe
Acronyme | Titre | Resp. sc | Début – fin | |
---|---|---|---|---|
LUDAU | ![]() | Découverte peu et non-supervisée d’unités audio à l’aide d’apprentissage profond | Thomas PELLEGRINI | 2018 – 2023 |
ALAIA | ![]() | Apprentissage des Langues Assisté par Intelligence Artificielle | Isabelle FERRANÉ | 2019 – 2023 |
PhLEs-NID | Dispositif non invasif evaluant l’éfficacité pharyngo-laryngée | Jérôme FARINAS | 2022 – 2026 | |
RUGBI [Contrat terminé] | ![]() | Recherche d’unités linguistiques pertinentes pour améliorer la mesure de l’intelligibilité de la parole altérée par des troubles de production pathologique | Jérôme FARINAS | 2018 – 2022 |
RIDDLE [Contrat terminé] | Robots perceptuels et interactifs dédiés aux environnement quotidiens | Isabelle FERRANÉ | 2012 – 2015 | |
ARTIS [Contrat terminé] | ![]() | Inversion articulatoire de la parole audiovisuelle pour la parole augmentée | Régine ANDRÉ-OBRECHT | 2009 – 2013 |
Acronyme | Titre | Resp. sc | Début – fin | |
---|---|---|---|---|
AudioToolBox [Contrat terminé] | Prestation TTT : AudioToolBox | Julien PINQUIER | 2017 – 2018 | |
ECREME [Contrat terminé] | ![]() | Allocation Doctorale : Expertises Musicale et Cognitive pour Recommandation Musicale personnaliséE | Julien PINQUIER | 2017 – 2020 |
TAPAS [Contrat terminé] | ![]() | Training Network on Automatic Processing of PAthological Speech | Julie MAUCLAIR | 2017 – 2022 |
VICTORIA [Contrat terminé] | ![]() | Video analysis for Investigation of Criminal and TerrORIst Activities | Philippe JOLY | 2017 – 2020 |
VOICE4PD – MSA [Contrat terminé] | Diagnostic différentiel entre la maladie de Parkinson et latrophie multisystématisée par analyse numérique de la parole | Julie MAUCLAIR | 2016 – 2023 | |
CIESS [Contrat terminé] | Contribution, indexation, et enrichissement d’un corpus de sons de l’environnement | Régine ANDRÉ-OBRECHT | 2013 – 2016 | |
DIADEMS [Contrat terminé] | Description, Indexation, Accés aux Documents Ethnomusicologiques et Sonores | Régine ANDRÉ-OBRECHT | 2013 – 2016 |
Acronyme | Titre | Resp. sc | Début – fin | |
---|---|---|---|---|
AUDIOCAP [Contrat terminé] | Audition et handicap dans le bruit vers la restauration de lintelligibilité de la parole | Julien PINQUIER | 2019 – 2022 | |
EVOLEX2 [Contrat terminé] | Apport de la reconnaissance vocale pour le diagnostic de dysfonctionnements cognitifs légers | Julien PINQUIER | 2019 – 2021 | |
INGPRO [Contrat terminé] | Recherche et Sociétés : Incidence des gestes sur la prononciation | Isabelle FERRANÉ | 2019 – 2021 | |
SAMI [Contrat terminé] | ![]() | Allocation Doctorale : Système automatisé de mesure de lintelligibilité | Julien PINQUIER | 2018 – 2021 |
Mesure de compréhenion de la parole [Contrat terminé] | Mesure de compréhension de la parole : équipement électronique intelligent de mesure de la compréhension de la parole basée sur une approche cognitive sur l’exemple de la compréhension humaine | Jérôme FARINAS | 2012 – 2015 |