Publications - SAMoVA

International journals articles

Sebastião Quintas, Robin Vaysse, Mathieu Balaguer, Vincent Roger, Julie Mauclair, Jérôme Farinas, Virginie Woisard, Julien Pinquier, Julien Pinquier

SAMI: an M-Health application to telemonitor intelligibility and speech disorder severity in head and neck cancers

Frontiers in Artificial Intelligence, 2024, 7, ⟨10.3389/frai.2024.1359094⟩

Accès: https://hal.science/hal-04595273

Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

Automatic modelling of perceptual judges in the context of head and neck cancer speech intelligibility

International Journal of Language and Communication Disorders, 2024, pp.1–14. ⟨10.1111/1460-6984.13004⟩

Accès: https://hal.science/hal-04405083

Renée Speyer, Mathieu Balaguer, Emmanuelle Cugy, Clémence Devoucoux, Sylvain Morinière, Gaëlle Soriano, Eric Vérin, Virginie Woisard

Expert Consensus on Clinical Decision Making in the Disease Trajectory of Oropharyngeal Dysphagia in Adults: An International Delphi Study

Journal of Clinical Medicine, 2023, 12 (20), pp.6572. ⟨10.3390/jcm12206572⟩

Accès: https://hal.science/hal-04595268

Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

Development of a holistic communication score (HoCoS) in patients treated for oral or oropharyngeal cancer: Preliminary validation

International Journal of Language and Communication Disorders, 2023, 58 (1), pp.39-51. ⟨10.1111/1460-6984.12766⟩

Accès: https://hal.science/hal-03765649v2

Lionel Pibre, Jorge Francisco Madrigal Diaz, Cyrille Equoy, Frédéric Lerasle, Thomas Pellegrini, Julien Pinquier, Isabelle Ferrané

Audio-video fusion strategies for active speaker detection in meetings

Multimedia Tools and Applications, 2022, 2022, pp.1-26. ⟨10.1007/s11042-022-13746-7⟩

Accès: https://hal.science/hal-03792965

Léo Cances, Etienne Labbé, Thomas Pellegrini

Comparison of Semi-supervised Deep Learning Algorithms for Audio Classification

EURASIP Journal on Audio, Speech, and Music Processing, 2022, 2022 (1, article 23), pp.1-14. ⟨10.1186/s13636-022-00255-6⟩

Accès: https://hal.science/hal-03855042

Vincent Roger, Jérôme Farinas, Julien Pinquier

Deep neural networks for automatic speech processing: a survey from large corpora to limited data

EURASIP Journal on Audio, Speech, and Music Processing, 2022, article 19, pp.1-15. ⟨10.1186/s13636-022-00251-w⟩

Accès: https://hal.science/hal-03755976

Timothy Pommée, Mathieu Balaguer, Julie Mauclair, Julien Pinquier, Virginie Woisard

Criteria for creating new standard reading passages for the assessment of speech and voice: A Delphi consensus study

Clinical Linguistics & Phonetics, 2022, 37 (8), pp.722-741. ⟨10.1080/02699206.2022.2080589⟩

Accès: https://hal.science/hal-04595275

Mathieu Balaguer, Timothy Pommée, Julien Pinquier, Jérôme Farinas, Virginie Woisard, Florence Sordes

Development and preliminary validation of the questionnaire ‘Evaluation of the constitution of social circles (ECSC)’ in patients treated for cancer of the upper aerodigestive tract

Folia Phoniatrica et Logopaedica, 2022, 75 (1), pp.52-66. ⟨10.1159/000525352⟩

Accès: https://hal.science/hal-03716864

Libio Gonçalves Braz, Lionel Fontan, Julien Pinquier, Michael A Stone, Christian Füllgrabe

OPRA-RS: A Hearing-Aid Fitting Method Based on Automatic Speech Recognition and Random Search

Frontiers in Neuroscience, 2022, 16, pp.779048. ⟨10.3389/fnins.2022.779048⟩

Accès: https://ut3-toulouseinp.hal.science/hal-03582025

National journals articles

Jérôme Farinas

La modélisation automatique de l’intelligibilité pour améliorer la qualité de vie des patients atteints de troubles de la parole : un exemple d’IA dans le domaine médical

A.N.A.E. Approche neuropsychologique des apprentissages chez l’enfant, 2024, 36 (189), pp.137-141

Accès: https://hal.science/hal-04602548v2

Mathieu Balaguer, Timothy Pommée, Jérôme Farinas, Julien Pinquier, Virginie Woisard

Paramètres perceptifs expliquant la sévérité du trouble de parole mesurée automatiquement en cancérologie ORL

Rééducation orthophonique, 2021, Chapitre : “De l’exploration à la prise en soins de la voix chez l’adulte : données actuelles.. sur la voie des voix”, 286, pp.1-13

Accès: https://ut3-toulouseinp.hal.science/hal-03277422

Mathieu Balaguer, Josiane Percodani, Virginie Woisard

Le Carcinologic Handicap Index (CHI) : questionnaire d’autoévaluation du handicap à destination des patients traités pour cancer des VADS

Annales françaises d’Oto-rhino-laryngologie et de Pathologie Cervico-faciale, 2017, 134 (6), pp.382-387. ⟨10.1016/j.aforl.2016.07.021⟩

Accès: https://hal.science/hal-02553232

National journals articles

Sylvain Detey, Lionel Fontan, Thomas Pellegrini

Traitement de la prononciation en langue étrangère : approches didactiques, méthodes automatiques et enjeux pour l’apprentissage

In : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 57, N. 3, (on line), 2016.

URL : https://www.atala.org/Traitement-de-la-prononciation-en – https://oatao.univ-toulouse.fr/19173/
BibTeX
Lionel Fontan, Cynthia Magnen, Julien Tardieu, Isabelle Ferrané, Julien Pinquier, Jérôme Farinas, Pascal Gaillard, Xavier Aumont

Comparaison de mesures perceptives et automatiques de l’intelligibilité : application à de la parole simulant la presbyacousie

In : Traitement Automatique des Langues (TAL), Association pour le Traitement Automatique des Langues (ATALA), Vol. 55, N. 2, pp. 151-174, March 2015.

Abstract URL : http://www.atala.org/Comparaison-de-mesures-perceptives – https://oatao.univ-toulouse.fr/15274/
BibTeX
Blandine Boudet, Thérèse Giacobini, Isabelle Ferrané, Carine Fortin, Christophe Mollaret, Frédéric Lerasle, Pierre Rumeau

Quels sont les objets égarés à domicile par les personnes âgées fragiles ? Une étude pilote sur 60 personnes.

In : Neurologie – Psychiatrie – Gériatrie (NPG), Elsevier, Vol. Vol. 14/79, pp. 38-42, 2014.

URL : https://oatao.univ-toulouse.fr/13000/
BibTeX
David Janiszek, Damien Pellier, Julie Mauclair, Laetitia Boulc’H, Jean-Louis Baron, Yannick Parchemal

Utilisation de la robotique pédagogique pour enseigner l’intelligence artificielle : une expérience d’approche par projet auprès d’étudiants en informatique.

In : Sciences et Technologies de l’Information et de la Communication pour l’Éducation et la Formation (STICEF), Association des Technologies de l’Information pour l’Education et la Formation, Paris, Vol. 18, (on line), 2011.

URL : http://sticef.univ-lemans.fr/num/vol2011/07r-janiszek/sticef_2011_janiszek_07rp.html
BibTeX
Jérôme Farinas, Jean-Luc Rouas, François Pellegrino, Régine André-Obrecht

Extraction automatique de paramètres prosodiques pour l’identification automatique des langues

In : Traitement du Signal, GRETSI : Groupement de Recherche en Traitement du Signal et des Images, Vol. 22, N. 2, pp. 81-97, 2005.

URL : http://documents.irevues.inist.fr/bitstream/handle/2042/2443/02%22Andr%E9-Obrecht+couleur.pdf?sequence=1
BibTeX
Julien Pinquier, Jean-Luc Rouas, Régine André-Obrecht

Fusion de paramètres pour une classification automatique parole/musique robuste

In : Technique et science informatiques (TSI) : Fusion numérique/symbolique, Hermès, 8, quai du marche neuf, F-75004 Paris, Vol. 22, pp. 831-852, 2003.

BibTeX
Régine André-Obrecht, Abdelouafi Meziane, Bruno Jacob

Modélisation de la durée des sons dans un système de reconnaissance automatique de la parole

In : Comptes Rendus de l’Académie des Sciences, Académie des Sciences, Elsevier, Paris, Vol. t327 série IIb, pp. 379-382, 1999.

BibTeX

Special issues of journal

Philippe Ercolessi, Christine Senac, Hervé Bredin, Sandrine Mouysset

Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d’histoires

Dans : Revue des Sciences et Technologies de l’Information, Hermès Science, Vol. 15 N. 2, pp. 41-66, 2012.

URL : https://www.irit.fr/publis/SAMOVA/
BibTeX
Ebroul Iquierdo, Jenny Bennois-Pineau, Régine André-Obrecht

Special Issue on Content Based Multimedia Indexing and Retrieval

Dans : Signal Processing: Image Communication, Elsevier, Vol. 22, Issues 7-8, 2007.

BibTeX
Régine André-Obrecht

Special Issue on Speaker Recognition and its Commercial and Forensic Applications

Dans : International Journal Speech Communication, N.H Elsevier ISSN 0167-6393, North Holland, Vol. 31, Nos 2-3, juin 2000.

BibTeX
Philippe Joly, Hae-Kwang Kim

Efficient Automatic Analysis of Camera Work and Microsegmentation of Video Using Spatio-Temporal Images

Dans : Signal Processing : Image Communication, Elsevier, Eurasip, Amsterdam, Vol. 8(4), mai 1996.

BibTeX

International conferences articles

Modan Tailleur, Julien Pinquier, Laurent Millot, Corsin Vogel, Mathieu Lagrange

EMVD dataset: a dataset of extreme vocal distortion techniques used in heavy metal

21st International Conference on Content-based Multimedia Indexing (CBMI 2024), Sep 2024, Reykjavik, Iceland

Accès: https://hal.science/hal-04620072

Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier

Detection of Pharyngolaryngeal Activities in Real-World Settings Using Wearable Sensors

46th annual international conference of the IEEE engineering in medicine and biology society (EMBC 2024), EMBC: Engineering in Medicine and Biology Society, Jul 2024, Orlando (Florida), United States. à paraître

Accès: https://hal.science/hal-04561003

Adrien Lafore, Clément Pagés, Leila Moudjari, Sebastião Quintas, Isabelle Ferrané, Hervé Bredin, Thomas Pellegrini, Farah Benamara, Jérôme Bertrand, Marie-Françoise Bertrand, Véronique Moriceau, Jérôme Farinas

Premier système IRIT-MyFamillyUp pour la compétition sur la reconnaissance des émotions Odyssey 2024

35èmes Journées d’Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024), Université Toulouse 3 Paul Sabatier; Université Toulouse Jean Jaurès, Jul 2024, Toulouse, France. pp.502-511

Accès: https://hal.science/hal-04594251

Taissir Fekih Romdhane, Mohamed Ibn Khedher, Mounim A El-Yacoubi

PredictStr: a balanced benchmark dataset for improve stroke prediction

16th International Conference on Human System Interaction (HSI), Jul 2024, Paris, France

Accès: https://hal.science/hal-04622267

Sylvain Detey, Verdiana De Fino, Lionel Fontan

Morphophonological ambiguities and automatic assessment of spoken L2 lexical forms for pedagogical purposes: a pilot study among Japanese learners of French

33rd Conference of the European Second Language Association (EuroSLA 2024), Université Montpellier; European Second Language Association (EuroSLA), Jul 2024, Montpellier, France

Accès: https://shs.hal.science/halshs-04580503

Adrien Lafore, Clément Pagés, Leila Moudjari, Sebastião Quintas, Hervé Bredin, Thomas Pellegrini, Farah Benamara, Isabelle Ferrané, Jérôme Bertrand, Marie-Françoise Bertrand, Véronique Moriceau, Jérôme Farinas

IRIT-MFU Multi-modal systems for emotion classification for Odyssey 2024 challenge

Odyssey 2024: The Speaker and Language Recognition Workshop, Jun 2024, Québec, Canada. pp.296-302, ⟨10.21437/odyssey.2024-42⟩

Accès: https://hal.science/hal-04594287

Joonas Kalda, Clément Pagés, Ricard Marxer, Tanel Alumäe, Hervé Bredin

PixIT: Joint Training of Speaker Diarization and Speech Separation from Real-world Multi-speaker Recordings

The Speaker and Language Recognition Workshop (Odyssey 2024), Jun 2024, Quebec City, France. pp.115-122, ⟨10.21437/odyssey.2024-17⟩

Accès: https://hal.science/hal-04649858

Martin Lebourdais, Marie Tahon, Antoine Laurent, Sylvain Meignier

Automatic Speech Interruption Detection: Analysis, Corpus, and System

Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-Coling 2024), ELRA Language Resources Association (ELRA); International Committee on Computational Linguistics (ICCL), May 2024, Torino, Italy. à paraître

Accès: https://hal.science/hal-04576488

Marvin Lavechin, Marianne Métais, Hadrien Titeux, Alodie Boissonnet, Jade Copet, Morgane Rivière, Elika Bergelson, Alejandrina Cristia, Emmanuel Dupoux, Hervé Bredin

Brouhaha: multi-task training for voice activity detection, speech-to-noise ratio, and C50 room acoustics estimation

IEEE Automatic Speech Recognition and Understanding (ASRU 2023 ), IEEE, Dec 2023, Taipei, Taiwan. pp.1–7

Accès: https://hal.science/hal-04247647

Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

Can we use speaker embeddings on spontaneous speech obtained from medical conversations to predict intelligibility?

IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2023), IEEE, Dec 2023, Taipei, Taiwan. à paraître

Accès: https://hal.science/hal-04230836

National conferences articles

Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané

Erreurs de prononciation en L2 : comparaison de méthodes pour la détection et le diagnostic guidés par la didactique

31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.361-370

Accès: https://inria.hal.science/hal-04623087

Lucas Block Medin, Lucile Gelin, Thomas Pellegrini

Adaptation de modèles auto-supervisés pour la reconnaissance de phonèmes dans la parole d’enfant

31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.231-241

Accès: https://inria.hal.science/hal-04623075

Sebastião Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier

Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales

31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.102-111

Accès: https://inria.hal.science/hal-04623063

Mathieu Balaguer, Lucile Gelin, Clémence Devoucoux, Camille Galant, Muriel Lalain, Alain Ghio, Jérôme Farinas, Julien Pinquier, Virginie Woisard

Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes

31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.61-70

Accès: https://inria.hal.science/hal-04623060

Verdiana De Fino, Isabelle Ferrané, Julien Pinquier, Lionel Fontan

Peut-on évaluer la compréhensibilité de la parole sans référence quant aux intentions de communication du locuteur ? Une étude auprès d’apprenants germanophones de FLE

31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024), Jul 2024, Toulouse, France. pp.492-501

Accès: https://inria.hal.science/hal-04623099

Romain Contrain, Julien Pinquier, Lionel Fontan, Isabelle Ferrané

Détection et classification automatiques d’erreurs de prononciation en L2 : approche basée sur les connaissances didactiques

Journée commune AFIA-TLH / AFCP “Extraction de connaissances interprétables pour l’étude de la communication parlée” (2023), Association Française pour l’Intelligence Artificielle (AFIA), collège Technologies du Langage Humain (TLH); Association Francophone de la Communication Parlée (AFCP), Dec 2023, Avignon, France

Accès: https://hal.science/hal-04331354

Verdiana De Fino, Isabelle Ferrané, Lionel Fontan, Julien Pinquier

Prédiction de la compréhensibilité de la parole d’apprenants de français

Accès: https://hal.science/hal-04329163

Lila Gravellier, Maxime Le Coz, Jérôme Farinas, Julien Pinquier

Evaluation de la détection automatique des activités pharyngolaryngées dans les signaux d’auscultation cervicale à haute résolution chez les personnes âgées

3ème journée de la Société Française de Déglutition et de Dysphagie (SF2D 2023), Société Française de Déglutition et de Dysphagie, Nov 2023, Toulouse, France

Accès: https://hal.science/hal-04560917

Mathieu Balaguer, Julien Pinquier, Jérôme Farinas, Virginie Woisard

Mesure du trouble de parole dans le suivi cancérologique grâce à la reconnaissance automatique de la parole

55e Congrès de la Société Française de Chirurgie Cervico-Faciale (SFCCF 2023), Université de Nantes; Société Française de Chirurgie Cervico-Faciale, Nov 2023, Nantes, France

Accès: https://hal.science/hal-04297963

Mathieu Balaguer

Parole et communication après cancer oral ou oropharyngé : l’évaluation clinique au cours du suivi du patient

58e Congrès Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale (2023), Société Française de Stomatologie, Chirurgie Maxillo-Faciale et Chirurgie orale, Oct 2023, Toulouse, France

Accès: https://hal.science/hal-04230870

Books

Etienne Sicard, Anne Menin-Sicard, Marie Daumet, Stéphanie Perriere, Océane Barbera

Evaluation de la voix avant/après suivi orthophonique -à propos de la méthodologie d’évaluation et de la fiabilité des mesures chiffrées

Ortho Editions. Efficacité des thérapies, Ortho Editions, pp.233-264, 2017, 978-2-36235-100-6

Accès: https://hal.science/hal-02424850

Alexandre Boyer, Etienne Sicard

Basis of Electromagnetic Compatibility of Integrated Circuits – A modeling approach using IC-EMC

Presses Universitaires du Midi – Collection Pour l’ingénieur. Presses universitaires du Midi (PUM), 390p., 2017, 978-2-8107-0522-1

Accès: https://hal.science/hal-01951651

Books parts

Marie Garnier

Automatic correction of adverb placement errors for CALL

In : Eurocall12. G Lund (Eds.) , EUROCALL Association, (electronic medium), July 2012.

BibTeX
Hervé Bredin, Aurélien Mayoue, Gérard Chollet

Talking-Face Verification

In : Guide to Biometric Reference Systems and Performance Evaluation. Dijana Petrovska, Gérard Chollet, Bernadette Dorizzi (Eds.) , Springer, 10, pp. 297-326, 2009.

BibTeX
Brice Burger, Isabelle Ferrané, Frédéric Lerasle

Towards multimodal interface for interactive robots: challenges and robotic systems description

In : Cutting Edge Robotics 2009. Kordic Vedran (Eds.) , INTECH, (on line), August 2009.

URL : http://intechweb.org/invitations.php?code=4b5cb9fc911b854ff9bd08e5a7ad866f&PHPSESSID=7d013daoo3i48pshqjg610amf7
BibTeX
Khalid Daoudi

Iterated Function Systems and some generalizations: Local Regularity Analysis and Multifractal Modeling of Signals

In : Scaling Laws, Fractals and Wavelets. Patrice Abry, Paulo Gonçalves, Jacques Lévy Véhel (Eds.) , ISTE – WILEY, pp. 301-332, January 2009.

BibTeX
Gérard Chollet, Rémi Landais, Thomas Hueber, Hervé Bredin, Chafic Mokbel, Patrick Perrot, Leila Zouari

Some Experiments in Audio-Visual Speech Processing

In : Advances in Nonlinear Speech Processing. Mohamed Chetouani (Eds.) , Springer-Verlag, pp. 28-56, Vol. 4885/2007, LNCS, 2007.

BibTeX
Bouchra Abboud, Hervé Bredin, Guido Aversano , Gérard Chollet

Audio-visual Identity Verification: An Introductory Overview

In : Progress in Nonlinear Speech Processing. Yannis Stylianou, Marcos Faundez-Zanuy, Anna Eposito (Eds.) , Springer-Verlag, pp. 118-134, Vol. 4391/2007, LNCS, 2007.

BibTeX
Philippe Joly

Descriptions des séquences d’images

In : L’indexation multimédia Description et recherche automatiques. P. Gros (Eds.) , Hermès, pp. 119-136, Traité IC2, série Traitement du signal et de l’image, May 2007.

BibTeX
Jorge Gutierrez, Jean-Luc Rouas, Régine André-Obrecht

Application of uncertainty-based methods to fuse language identification expert decision

In : Modern Information Processing: From Theory to Application (Selected Papers of the IPMU’2004). B. Bouchon-Meunier, G. Coletti, R.R. Yager (Eds.) , Elsevier, pp. 255-268, 2006.

BibTeX
Farah Benamara, Véronique Moriceau

Prepositions in Cooperative Question-Answering Systems: a Preliminary Analysis

In : Syntax and semantics of prepositions. Patrick Saint-Dizier (Eds.) , Springer, pp. 307-330, Vol. 29, Text, Speech and Language Technology, November 2006.

URL : http://www.springerlink.com/content/978-1-4020-3873-0
BibTeX
Philippe Joly

Enjeux d’une normalisation pour l’indexation des contenus multimédia

In : Paradigmes et enjeux de l’informatique. N Bidoit, L Fariñas del Cerro, S Fdida, B Vallée (Eds.) , Hermès Science, pp. 157-169, Informatique et Systèmes d’Information, February 2005.

BibTeX

Thesis and HDR

Verdiana De Fino

Caractérisation et mesure de la compréhensibilité de la parole de locuteurs non natifs dans le cadre de l’apprentissage des langues

Informatique. Université Paul Sabatier – Toulouse III, 2024. Français. ⟨NNT : ⟩

Accès: https://hal.science/tel-04582745

Jérôme Farinas

La parole : du traitement automatique à la mesure de l’intelligibilité

Intelligence artificielle [cs.AI]. Université Paul Sabatier (Toulouse 3), 2023

Accès: https://hal.science/tel-04381096

Benjamin Chamand

Adaptation d’approches connexionnistes non supervisées pour l’analyse de contenus d’images et de sons

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30104⟩

Accès: https://theses.hal.science/tel-04229622

Robin Vaysse

Caractérisation automatique du rythme de la parole : application aux cancers des voies aéro-digestives supérieures et à la maladie de Parkinson

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2023. Français. ⟨NNT : 2023TOU30062⟩

Accès: https://theses.hal.science/tel-04198849

Sebastião Quintas

Deep learning approaches to assess speech intelligibility of head and neck cancer

Artificial Intelligence [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. English. ⟨NNT : 2022TOU30272⟩

Accès: https://theses.hal.science/tel-04094765

Estelle Randria

Compréhensibilité de contenus audiovisuels : quelles approches pour une mesure objective ?

Informatique [cs]. Université Paul Sabatier (Toulouse 3), 2022. Français. ⟨NNT : 2022TOU30258⟩

Accès: https://theses.hal.science/tel-04064038

Vincent Roger

Modélisation de l’indice de sévérité du trouble de la parole à l’aide de méthodes d’apprentissage profond : d’une modélisation à partir de quelques exemples à un apprentissage auto-supervisé via une mesure entropique

Apprentissage [cs.LG]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30180⟩

Accès: https://theses.hal.science/tel-03935738

Lucile Gelin

Reconnaissance automatique de la parole d’enfants apprenant·e·s lecteur·ice·s en salle de classe : modélisation acoustique de phonèmes

Intelligence artificielle [cs.AI]. Université Paul Sabatier – Toulouse III, 2022. Français. ⟨NNT : 2022TOU30031⟩

Accès: https://theses.hal.science/tel-03715653

Léo Cances

Apprentissage profond faiblement supervisé et semi-supervisé pour la détection d’évènements sonores

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30262⟩

Accès: https://theses.hal.science/tel-03683219

Timothy Pommée

Les mesures d’intelligibilité : état de l’art, considérations pratiques pour l’applicabilité clinique et explorations acoustiques

Sciences de l’information et de la communication. Université Paul Sabatier – Toulouse III, 2021. Français. ⟨NNT : 2021TOU30141⟩

Accès: https://theses.hal.science/tel-04136563

Reports

Etienne Sicard, Anne Menin-Sicard

La diadococinésie et son application en orthophonique clinique

[Rapport de recherche] INSA 2020, INSA : Institut National des Sciences Appliquées de Toulouse. 2020

Accès: https://hal.science/hal-02512856

Etienne Sicard, Anne Menin-Sicard

Analyse de la qualité des phrases pour un bilan objectif de la parole

[Rapport de recherche] INSA Toulouse. 2019

Accès: https://hal.science/hal-02389764v2

Thomas Pellegrini, Céline Manenti, Julien Pinquier

The IRIT-UPS system @ ZeroSpeech 2017

[Research Report] IRIT. 2017

Accès: https://hal.science/hal-03131886

Maëlys Salingre, Jérôme Farinas, Stéphane Rabant

Automatic identification of French regional accent

[Rapport de recherche] IRIT. 2017

Accès: https://hal.science/hal-03120304

Reports

Archange Giscard Destiné

Recherche des expressions clés caractéristiques de linteraction entre locuteurs dans les documents audiovisuels

Master’s report, Université Paul Sabatier, June 2011.

Abstract URL : https://www.irit.fr/publis/SAMOVA/M2R/Memoire_M2R_ArchangeDestine.pdf
BibTeX
Noureddine Besbes

Indexation en intervenant d’un document vidéo par identification du visage

Master’s report, Université Paul Sabatier, June 2007.

URL : https://www.irit.fr/publis/SAMOVA/Memoire_M2R_Noureddine.pdf
BibTeX
Ihab Mallak

Description de comportements humains et interrogation.

Master’s report, Université de Toulouse, June 2006.

URL : http://www.phdgroup.org/ul-stsi-2005-2006.php
BibTeX
Hélène Lachambre

Caractérisation de la voix chantée

Master’s report, Institut National Polytechnique de Toulouse, June 2006.

BibTeX
Ali Mcheik

Application des matrices de similarité à la comparaison de contenus sonores

Master’s report, Université Paul Sabatier, June 2006.

BibTeX
Elie El Khoury

Segmentation et regroupement en locuteurs d’un document sonore

Master’s report, Université Paul Sabatier, June 2006.

BibTeX
Jeremy Philippeau

Caractérisation d’un intervenant dans un document audiovisuel

Internship report, Master Recherche 2IH, Université Paul Sabatier, June 2005.

BibTeX
Loïc Lefloch

Etude constractive de décodeurs acoustico-phonétique

Internship report, Master Recherche 2IH, Université Paul Sabatier, June 2005.

BibTeX
Christine Senac

Contribution à l’indexation multimedia

Research report, IRIT/2005-8-R, IRIT, March 2005.

BibTeX
José Anibal Arias

Méthodes à vecteurs de support et indexation sonore

Internship report, DEA IIL, Université Paul Sabatier, 2004.

BibTeX

team publications