Exploitation avancée des données de santé par de l'apprentissage collaboratif sécurisé // Advancing Health Data Exploitation through Secure Collaborative Learning
| ABG-138235 | Thesis topic | |
| 2026-04-13 | Public/private mixed funding |
CEA Paris-Saclay Laboratoire Instrumentation Intelligente, Distribuée et Embarquée
Saclay
Exploitation avancée des données de santé par de l'apprentissage collaboratif sécurisé // Advancing Health Data Exploitation through Secure Collaborative Learning
- Data science (storage, security, measurement, analysis)
Data intelligence dont Intelligence Artificielle / Défis technologiques / Génomique, protéomique / Sciences du vivant
Topic description
Depuis quelques années, l’apprentissage profond est utilisé avec succès dans de nombreux domaines et est de plus en plus intégré dans la recherche clinique et le domaine de la santé. La capacité à combiner des sources de données diverses, telles que la génomique et l’imagerie, améliore la prise de décision médicale. L’accès à de grands jeux de données hétérogènes est essentiel pour améliorer la qualité et la précision des modèles. L’apprentissage fédéré est actuellement développé pour répondre à cette exigence, en offrant la possibilité d’entraîner des modèles de manière décentralisée garantissant que les données brutes restent stockées localement du côté client (entité qui génère les données sensibles). Plusieurs frameworks open-source intègrent des protocoles de calcul sécurisé pour l’apprentissage fédéré, mais leur applicabilité au domaine de la santé demeure limitée et soulève des enjeux liés à la souveraineté des données.
Dans ce contexte, un framework français, actuellement développé par le CEA-LIST, introduit une architecture d’apprentissage fédéré edge-to-cloud intégrant un chiffrement de bout en bout, avec notamment le chiffrement homomorphe (Fully Homomorphic Encryption), et une résilience face aux attaques malveillantes. Grâce à ce framework, ce projet vise à fournir des composants modulaires et sécurisés pour l’apprentissage fédéré afin de favoriser l’innovation en IA appliquée au domaine de la santé et notamment à la génomique.
Ce projet se focalisera sur trois axes principaux :
1) Déploiement, surveillance et optimisation de modèles d’apprentissage profond au sein de solutions d’apprentissage fédéré et décentralisé.
2) Intégration de grands modèles dans l’apprentissage collaboratif.
3) Développement de méthodes d’agrégation pour des situations non IID (Independant and Identically Distributed).
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Recently, deep learning has been successfully applied in numerous domains and is increasingly being integrated into healthcare and clinical research. The ability to combine diverse data sources such as genomics and imaging enhances medical decision-making. Access to large and heterogeneous datasets is essential for improving model quality and predictive accuracy. Federated learning is currently developed to support this requirement offering an alternative by enabling decentralized model training while ensuring that raw data remains stored locally at the client side. Several open-source frameworks integrate secure computation protocols for federated learning but remains limited in its applicability to healthcare and raises issues related to data sovereignty. In this context, a French framework is currently developed by the CEA-LIST, introduces an edge-to-cloud federated learning architecture that incorporates end-to-end encryption, including fully homomorphic encryption (FHE) and resilience against adversarial threats. Through this framework, this project aims to deliver modular and secure federated learning components that foster further innovation in healthcare AI.
This project will focus on three core themes:
1) Deployment, monitoring and optimization of deep learning models within federated and decentralized learning solutions.
2) Integrating large models in collaborative learning.
3) Developing aggregation methods for non-IID situation.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département d’Instrumentation Numérique
Service : Service Monitoring, Contrôle et Diagnostic
Laboratoire : Laboratoire Instrumentation Intelligente, Distribuée et Embarquée
Date de début souhaitée : 01-10-2026
Ecole doctorale : Structure et Dynamique des Systèmes Vivants (SDSV)
Directeur de thèse : MEYER Vincent
Organisme : CEA
Laboratoire : DRF/JACOB//LBI
Dans ce contexte, un framework français, actuellement développé par le CEA-LIST, introduit une architecture d’apprentissage fédéré edge-to-cloud intégrant un chiffrement de bout en bout, avec notamment le chiffrement homomorphe (Fully Homomorphic Encryption), et une résilience face aux attaques malveillantes. Grâce à ce framework, ce projet vise à fournir des composants modulaires et sécurisés pour l’apprentissage fédéré afin de favoriser l’innovation en IA appliquée au domaine de la santé et notamment à la génomique.
Ce projet se focalisera sur trois axes principaux :
1) Déploiement, surveillance et optimisation de modèles d’apprentissage profond au sein de solutions d’apprentissage fédéré et décentralisé.
2) Intégration de grands modèles dans l’apprentissage collaboratif.
3) Développement de méthodes d’agrégation pour des situations non IID (Independant and Identically Distributed).
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Recently, deep learning has been successfully applied in numerous domains and is increasingly being integrated into healthcare and clinical research. The ability to combine diverse data sources such as genomics and imaging enhances medical decision-making. Access to large and heterogeneous datasets is essential for improving model quality and predictive accuracy. Federated learning is currently developed to support this requirement offering an alternative by enabling decentralized model training while ensuring that raw data remains stored locally at the client side. Several open-source frameworks integrate secure computation protocols for federated learning but remains limited in its applicability to healthcare and raises issues related to data sovereignty. In this context, a French framework is currently developed by the CEA-LIST, introduces an edge-to-cloud federated learning architecture that incorporates end-to-end encryption, including fully homomorphic encryption (FHE) and resilience against adversarial threats. Through this framework, this project aims to deliver modular and secure federated learning components that foster further innovation in healthcare AI.
This project will focus on three core themes:
1) Deployment, monitoring and optimization of deep learning models within federated and decentralized learning solutions.
2) Integrating large models in collaborative learning.
3) Developing aggregation methods for non-IID situation.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département d’Instrumentation Numérique
Service : Service Monitoring, Contrôle et Diagnostic
Laboratoire : Laboratoire Instrumentation Intelligente, Distribuée et Embarquée
Date de début souhaitée : 01-10-2026
Ecole doctorale : Structure et Dynamique des Systèmes Vivants (SDSV)
Directeur de thèse : MEYER Vincent
Organisme : CEA
Laboratoire : DRF/JACOB//LBI
Funding category
Public/private mixed funding
Funding further details
Presentation of host institution and host laboratory
CEA Paris-Saclay Laboratoire Instrumentation Intelligente, Distribuée et Embarquée
Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département d’Instrumentation Numérique
Service : Service Monitoring, Contrôle et Diagnostic
Candidate's profile
Master AI, Data Science
Apply
Close
Vous avez déjà un compte ?
Nouvel utilisateur ?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
Généthon
TotalEnergies
ANRT
Servier
ADEME
Laboratoire National de Métrologie et d'Essais - LNE
SUEZ
Aérocentre, Pôle d'excellence régional
Medicen Paris Region
Tecknowmetrix
Nokia Bell Labs France
ONERA - The French Aerospace Lab
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Nantes Université
Institut Sup'biotech de Paris
Ifremer
Groupe AFNOR - Association française de normalisation
-
JobRef. 137563Montréal, Canada
Centre de recherche du CHUMProfesseur.e-chercheur.e - Radiochimie pour le développement et la validation de radiotraceurs utilisés en imagerie médicale
Scientific expertises :Chemistry
Experience level :Senior
-
JobRef. 138202, Ile-de-France , France
Total EnergieGraduate Engineers / Scientists – M/F
Scientific expertises :Process engineering
Experience level :Junior
