Apprentissage distribué sur des flux de données sur application médicale et environnementale
ABG-133637 | Master internship | 5 months | 650 |
2025-10-01 |
- Computer science
Employer organisation
Website :
Le Laboratoire d’Informatique, Systèmes, Traitement de l’Information et de la Connaissance (LISTIC) est une Unité de Recherche (UR) de l’Université Savoie Mont Blanc (USMB), reconnue depuis 2003 par le Ministère en tant qu’équipe d’accueil (EA3703). Son projet scientifique se concentre sur l’apprentissage automatique et la fusion d’information ainsi que sur les réseaux et les systèmes. Ses travaux portent sur la modélisation, la spécification et le développement de théories, d’algorithmes et de systèmes pour extraire et gérer les connaissances, notamment dans les domaines de l’observation de la Terre et du comportement humain.
Description
L’apprentissage fédéré (Google, 2016) est une approche d’apprentissage distribué permettant d’entraîner un modèle global à partir de données réparties chez plusieurs clients, sans centraliser ces données. Cette méthode est particulièrement utilisée dans les domaines sensibles (santé, embarqué, IoT) pour des raisons de confidentialité. Chaque client du système possède un jeu de données local qui lui permet de s’entraîner et partager ensuite sa connaissance. Ce partage permet l’agrégation des modèles, une étape critique qui consiste en la fusion des paramètres obtenus par chaque client pour créer un modèle global plus général et redistribué à tous les participants. Néanmoins, les méthodes d’agrégation issues de l’état de l’art prennent peu en compte les structures de réseaux paires à paires et les flux de données évoluant dans le temps. Ces conditions illustrent pourtant les cas d’utilisation réels et augmentent le risque de pénaliser les performances du modèle général.
Nous nous concentrerons notamment sur deux aspects : (1) comprendre les changements de la distribution des données dans le temps sur l’apprentissage des modèles locaux et du modèle global pour de l’apprentissage fédéré centralisé (2) le développement de méthodes d’apprentissage fédéré décentralisées.
Le travail sera réalisé à l’aide d’un framework développé au laboratoire. Les tâches seront les suivantes :
- Prise en main et enrichissement du framework et des jeux de données.
- Etat de l’art sur l’apprentissage fédéré, les fonctions d’agrégation, l’apprentissage fédéré décentralisé et l’apprentissage continuel.
- Proposition d’une solution pour améliorer l’apprentissage des modèles locaux et globaux dans l’apprentissage fédéré et l’apprentissage fédéré décentralisé avec un flux de données.
- Rédaction d’un article de recherche
Ce stage vous permettra d’apprendre à :
- Maîtriser les principes et défis du deep learning et de l’apprentissage fédéré.
- Développer des compétences de méthodologie scientifique (lecture critique, évaluation, comparaison).
- Rédiger une publication scientifique (en tant que co-auteur).
- Préparer une éventuelle poursuite en doctorat ou en R&D dans l’industrie.
Profile
Nous recherchons un stagiaire de niveau bac+5, en master ou en école d'ingénieur.
Pour candidater, il est nécessaire d'avoir suivi une formation en informatique. Les connaissances attendues du candidats portent sur le deep learning, Tensorflow et Python.
Starting date
Vous avez déjà un compte ?
Nouvel utilisateur ?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
MabDesign
Aérocentre, Pôle d'excellence régional
Laboratoire National de Métrologie et d'Essais - LNE
Institut Sup'biotech de Paris
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Tecknowmetrix
Ifremer
TotalEnergies
CESI
ADEME
CASDEN
Groupe AFNOR - Association française de normalisation
PhDOOC
Nokia Bell Labs France
SUEZ
Généthon
ONERA - The French Aerospace Lab
MabDesign
ANRT