Evaluer et comparer des méthodes d’apprentissage fédéré sur application médicale et environnementale
ABG-133639 | Stage master 2 / Ingénieur | 5 mois | 650 |
01/10/2025 |
- Informatique
Établissement recruteur
Site web :
Le Laboratoire d’Informatique, Systèmes, Traitement de l’Information et de la Connaissance (LISTIC) est une Unité de Recherche (UR) de l’Université Savoie Mont Blanc (USMB), reconnue depuis 2003 par le Ministère en tant qu’équipe d’accueil (EA3703). Son projet scientifique se concentre sur l’apprentissage automatique et la fusion d’information ainsi que sur les réseaux et les systèmes. Ses travaux portent sur la modélisation, la spécification et le développement de théories, d’algorithmes et de systèmes pour extraire et gérer les connaissances, notamment dans les domaines de l’observation de la Terre et du comportement humain.
Description
L’apprentissage fédéré (Google, 2016) est une approche d’apprentissage distribué permettant d’entraîner un modèle global à partir de données réparties chez plusieurs clients, sans centraliser ces données. Cette méthode est particulièrement utilisée dans les domaines sensibles (santé, embarqué, IoT) pour des raisons de confidentialité. Chaque client du système possède un jeu de données local qui lui permet de s’entraîner et partager ensuite sa connaissance. Ce partage permet l’agrégation des modèles, une étape critique qui consiste en la fusion des paramètres obtenus par chaque client pour créer un modèle global plus général et redistribué à tous les participants. Néanmoins, cette méthode fonctionne beaucoup plus difficilement lorsque les clients ont des données hétérogènes. Nous utilisons dans ce cas une méthode appelée Clustered Federated Learning permettant de regrouper les clients qui ont des données similaires pour faciliter leur apprentissage. Le CFL peut être appliqué grâce à plusieurs méthodes, nous souhaitons les évaluer et les comparer en développant de nouvelles méthodes d’explicabilité d’IA.
Nous nous concentrerons notamment sur deux aspects : (1) tester des méthodes de clustering pour regrouper les clients au mieux en fonction de leurs données, et (2) développer une méthode permettant de mieux comprendre les résultats du clustering.
Un article de recherche est en cours de rédaction sur ce sujet. Les travaux de la personne recrutée seront utilisés pour cet article et la personne sera impliquée dans sa rédaction.
Le travail sera réalisé à l’aide d’un framework développé au laboratoire. Les tâches seront les suivantes :
- Initiation à l’apprentissage fédéré à travers la lecture d’articles.
- Prise en main du framework et des jeux de données.
- Benchmarking des méthodes de clustering.
- Développement d’une méthode d’explicabilité.
- Rédaction d’un article de recherche.
Ce stage vous permettra d’apprendre à :
- Maîtriser les principes et défis du deep learning et de l’apprentissage fédéré.
- Développer des compétences de méthodologie scientifique (lecture critique, évaluation, comparaison).
- Rédiger une publication scientifique (en tant que co-auteur).
- Préparer une éventuelle poursuite en doctorat ou en R&D dans l’industrie.
Profil
Nous recherchons un stagiaire de niveau bac+5, en master ou en école d'ingénieur.
Pour candidater, il est nécessaire d'avoir suivi une formation en informatique. Les connaissances attendues du candidats portent sur le deep learning, Tensorflow et Python.
Prise de fonction
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
Institut Sup'biotech de Paris
Tecknowmetrix
MabDesign
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
ANRT
PhDOOC
MabDesign
Laboratoire National de Métrologie et d'Essais - LNE
Nokia Bell Labs France
Groupe AFNOR - Association française de normalisation
TotalEnergies
Aérocentre, Pôle d'excellence régional
Généthon
CASDEN
ADEME
CESI
ONERA - The French Aerospace Lab
Ifremer
SUEZ