Je suis un doctorant en science des données à L’IRIT (Toulouse). Je travaille sur des corpus avec une quantité limitée de parole altérée. Je tiens également un blogue sur des visualisations que je réalisés, sur la recherche que j’effectue et sur des astuces autour de Linux. C’est par ici.

Mes intérêts

  • Je me concentre sur les algorithmes d’apprentissage automatique pour modéliser les connaissances avec peu ou beaucoup de données. Plus spécifiquement, j’aime utiliser l’apprentissage auto-supervisé pour extraire des connaissances à partir de données.

  • Dans ma thèse, j’ai adapté des techniques de réseaux neuronaux profonds dans un contexte de quelques images pour les signaux vocaux. Pour en savoir plus, consultez mon article sur le bilan de ma première année de doctorat.

  • Je fais de l’analyse de données pour produire des visualisations (la plupart d’entre elles sont disponibles sur mon blogue) et je participe à certaines projets open sources.

Résumé

Pour ma thèse, je suis encadré par Julien Pinquier, Jérôme Farinas et Virginie Woisard. Ma thèse consiste à réaliser un Système Automatique de Mesure de l’Intelligibilité (SAMI).

Les personnes atteintes de cancers ORL présentent des difficultés de prononciation après des chirurgies ou des radiothérapies. Il est important pour le praticien de pouvoir disposer d’une mesure reflétant la sévérité de la parole. Je propose deux approches pour créer une mesure automatique, bien que ne disposant que de peu de données (environ 1h d’enregistrements audio pour 128 locuteurs). La première est fondée sur des méthodes de “few shot”, tandis que la seconde est fondée sur la mesure entropique de caractéristiques de la parole (apprises avec un modèle auto-supervisé sur un corpus annexe). Nos résultats sur cette dernière ont permis d’envisager une application médicale. Ainsi, j’ai obtenu une subvention pour encadrer un ingénieur afin de réaliser une application livrée au CHU de Toulouse.

Vous pouvez retrouver mon résumé au complet ici ou aller sur mon LinkedIn.