Where PhDs and companies meet
Menu
Login

Exploitation avancée des données de santé par de l'apprentissage collaboratif sécurisé // Advancing Health Data Exploitation through Secure Collaborative Learning

ABG-138235 Thesis topic
2026-04-13 Public/private mixed funding
CEA Paris-Saclay Laboratoire Instrumentation Intelligente, Distribuée et Embarquée
Saclay
Exploitation avancée des données de santé par de l'apprentissage collaboratif sécurisé // Advancing Health Data Exploitation through Secure Collaborative Learning
  • Data science (storage, security, measurement, analysis)
Data intelligence dont Intelligence Artificielle / Défis technologiques / Génomique, protéomique / Sciences du vivant

Topic description

Depuis quelques années, l’apprentissage profond est utilisé avec succès dans de nombreux domaines et est de plus en plus intégré dans la recherche clinique et le domaine de la santé. La capacité à combiner des sources de données diverses, telles que la génomique et l’imagerie, améliore la prise de décision médicale. L’accès à de grands jeux de données hétérogènes est essentiel pour améliorer la qualité et la précision des modèles. L’apprentissage fédéré est actuellement développé pour répondre à cette exigence, en offrant la possibilité d’entraîner des modèles de manière décentralisée garantissant que les données brutes restent stockées localement du côté client (entité qui génère les données sensibles). Plusieurs frameworks open-source intègrent des protocoles de calcul sécurisé pour l’apprentissage fédéré, mais leur applicabilité au domaine de la santé demeure limitée et soulève des enjeux liés à la souveraineté des données.
Dans ce contexte, un framework français, actuellement développé par le CEA-LIST, introduit une architecture d’apprentissage fédéré edge-to-cloud intégrant un chiffrement de bout en bout, avec notamment le chiffrement homomorphe (Fully Homomorphic Encryption), et une résilience face aux attaques malveillantes. Grâce à ce framework, ce projet vise à fournir des composants modulaires et sécurisés pour l’apprentissage fédéré afin de favoriser l’innovation en IA appliquée au domaine de la santé et notamment à la génomique.

Ce projet se focalisera sur trois axes principaux :
1) Déploiement, surveillance et optimisation de modèles d’apprentissage profond au sein de solutions d’apprentissage fédéré et décentralisé.
2) Intégration de grands modèles dans l’apprentissage collaboratif.
3) Développement de méthodes d’agrégation pour des situations non IID (Independant and Identically Distributed).

------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Recently, deep learning has been successfully applied in numerous domains and is increasingly being integrated into healthcare and clinical research. The ability to combine diverse data sources such as genomics and imaging enhances medical decision-making. Access to large and heterogeneous datasets is essential for improving model quality and predictive accuracy. Federated learning is currently developed to support this requirement offering an alternative by enabling decentralized model training while ensuring that raw data remains stored locally at the client side. Several open-source frameworks integrate secure computation protocols for federated learning but remains limited in its applicability to healthcare and raises issues related to data sovereignty. In this context, a French framework is currently developed by the CEA-LIST, introduces an edge-to-cloud federated learning architecture that incorporates end-to-end encryption, including fully homomorphic encryption (FHE) and resilience against adversarial threats. Through this framework, this project aims to deliver modular and secure federated learning components that foster further innovation in healthcare AI.
This project will focus on three core themes:
1) Deployment, monitoring and optimization of deep learning models within federated and decentralized learning solutions.
2) Integrating large models in collaborative learning.
3) Developing aggregation methods for non-IID situation.

------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département d’Instrumentation Numérique
Service : Service Monitoring, Contrôle et Diagnostic
Laboratoire : Laboratoire Instrumentation Intelligente, Distribuée et Embarquée
Date de début souhaitée : 01-10-2026
Ecole doctorale : Structure et Dynamique des Systèmes Vivants (SDSV)
Directeur de thèse : MEYER Vincent
Organisme : CEA
Laboratoire : DRF/JACOB//LBI

Funding category

Public/private mixed funding

Funding further details

Presentation of host institution and host laboratory

CEA Paris-Saclay Laboratoire Instrumentation Intelligente, Distribuée et Embarquée

Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département d’Instrumentation Numérique
Service : Service Monitoring, Contrôle et Diagnostic

Candidate's profile

Master AI, Data Science
Partager via
Apply
Close

Vous avez déjà un compte ?

Nouvel utilisateur ?