Proposition de thèse : Caractérisation et identification automatique de dialectes
Thèse de l’école doctorale MITT, Université Paul Sabatier Toulouse III
Description du sujet
Le recherche en traitement automatique de la parole s'intéresse de plus en plus au traitement de grandes collections de données, dans des conditions de parole spontanée et conversationnelle. Les performances sont dépendantes de toutes les variabilités de la parole. Une de ces variabilités concerne l'appartenance dialectale du locuteur, qui induit de la variabilité tant au niveau de la prononciation phonétique, mais également au niveau de la morphologie des mots et de la prosodie. Nous proposons de réaliser un sujet de recherche sur la caractérisation automatique dialectale des locuteurs, en vue de diriger l'adaptation des systèmes de reconnaissance de la parole : la sélection de modèles acoustiques et prosodiques adaptées permettront d'améliorer des performances dans des conditions de reconnaissance indépendante du locuteur. La réalisation d'un tel système devra s'appuyer sur les avancées récentes en identification de la langue au niveau de la modélisation acoustique par exploration de réseaux de phonèmes et proposer une modélisation fine basée sur la micro et macro prosodie. Les bases de données disponibles au sein du projet sur la phonologie du français contemporain (http://www.projet-pfc.net/) permettront de disposer d'un large éventail de données sur les variances de prononciation. Le système final sera évalué lors des campagnes internationales organisées par le NIST sur la vérification de la langue, qui prennent maintenant en compte les variances dialectales (mandarin, anglais, espagnol et hindi) : http://www.nist.gov/speech/tests/lre/.
English version
The research in automatic speech processing is increasingly concerned at the treatment of large data collections, with spontaneous and conversational speech. The variability of speech alter the general performances. The dialect of the speaker is of these variability sources, who leads in alterations in terms of both the phonetic pronunciation, but also in terms of the morphology of words and prosody. We propose to conduct a research on the automatic characterization of the dialects, in order to adapt automatic speech recognition systems: by selection of acoustic and prosodic models suited to improve performance in speaker independent recognition conditions. The realization of such a system should be based on recent advances in the identification of the language in the exploration of phonemes modeling lattices and propose a fine modelling based on micro and macroprosody. The databases available within the PFC project (http://www.projet-pfc.net/) will provide a wide range of data on variances pronunciation. The final system will be evaluated during international campaigns conducted by the NIST on language verification, which now take into account the dialect identification (Mandarin, English, Spanish and Hindi): http://www.nist.gov/speech/tests/lre/.
Connaissances et compétences requises
- compétences en informatique (en particulier traitement automatique de la parole)
- compétences en linguistique (phonologie, prosodie)
Contact
Un financement sera attribué aux meilleurs candidats de thèse de l'Ecole Doctorale, il faut donc nous contacter avant le 10 juin pour pouvoir participer à ce classement.
Jérôme Farinas, équipe SAMOVA, IRIT, tél : 05 61 55 74 34