ÉMULATION D'ESSAIS CIBLES A PARTIR DE DONNEES OBSERVATIONNELLES : VARIABLES INSTRUMENTALES, APPRENTISSAGE FEDERE ET ESTIMANDS CAUSAUX // Target Trial emulation from observational data: Instrumental variables, federated learning & causal estimands
|
ABG-139179
ADUM-75230 |
Sujet de Thèse | |
| 19/05/2026 | Contrat doctoral |
Sorbonne Université SIS (Sciences, Ingénierie, Santé)
Paris - Ile-de-France - France
ÉMULATION D'ESSAIS CIBLES A PARTIR DE DONNEES OBSERVATIONNELLES : VARIABLES INSTRUMENTALES, APPRENTISSAGE FEDERE ET ESTIMANDS CAUSAUX // Target Trial emulation from observational data: Instrumental variables, federated learning & causal estimands
- Biologie
Description du sujet
Les essais contrôlés randomisés (ECR) demeurent le gold standard pour établir la causalité, mais leur réalisation est limitée par des contraintes de faisabilité et de coût ; de plus, la question de la généralisabilité des résultats en vie réelle et/ou à d'autres populations demeure. Le cadre de
l'émulation d'essais cibles s'est imposé comme une approche structurée permettant de reproduire, à partir de données observationnelles complexes le protocole de l'ECR qui aurait répondu à la question d'intérêt.
Les méthodes statistiques permettant de l'implémenter restent un champ de recherche actif. Le choix de l'estimand causal conditionne les différentes stratégies d'utilisation des données; les variables instrumentales permettent de prendre en compte certains biais; l'apprentissage fédéré d'utiliser plusieurs sources sous contraintes de confidentialité.
L'objectif général de cette thèse est de comparer et d'appliquer des approches d'inférence causale dans le cadre de l'émulation d'essais cibles. Nous nous appuierons tout d'abord sur des simulations de données fictives afin de vérifier la performance des approches proposées dans un cadre maîtrisé où les effets réels sont connus, puis sur des applications pratiques à l'aide de données observationnelles issues de différentes sources.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Randomised controlled trials (RCTs) remain the gold standard for establishing causality, but their implementation is limited by feasibility and cost constraints; furthermore, the question of the generalisability of results to real-world settings and/or other populations remains. The framework of
target trial emulation has emerged as a structured approach enabling the reproduction, from complex observational data, of the RCT protocol that would have answered the question of interest.
The statistical methods required to implement it remain an active field of research. The choice of causal estimand determines the various strategies for using the data; instrumental variables allow certain biases to be accounted for; federated learning enables the use of multiple sources under confidentiality constraints.
The overall objective of this thesis is to compare and apply causal inference approaches within the framework of target trial emulation. We will first rely on simulations of fictitious data to verify the performance of the proposed approaches in a controlled setting where the true effects are known, and then on practical applications using observational data from various sources.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
l'émulation d'essais cibles s'est imposé comme une approche structurée permettant de reproduire, à partir de données observationnelles complexes le protocole de l'ECR qui aurait répondu à la question d'intérêt.
Les méthodes statistiques permettant de l'implémenter restent un champ de recherche actif. Le choix de l'estimand causal conditionne les différentes stratégies d'utilisation des données; les variables instrumentales permettent de prendre en compte certains biais; l'apprentissage fédéré d'utiliser plusieurs sources sous contraintes de confidentialité.
L'objectif général de cette thèse est de comparer et d'appliquer des approches d'inférence causale dans le cadre de l'émulation d'essais cibles. Nous nous appuierons tout d'abord sur des simulations de données fictives afin de vérifier la performance des approches proposées dans un cadre maîtrisé où les effets réels sont connus, puis sur des applications pratiques à l'aide de données observationnelles issues de différentes sources.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Randomised controlled trials (RCTs) remain the gold standard for establishing causality, but their implementation is limited by feasibility and cost constraints; furthermore, the question of the generalisability of results to real-world settings and/or other populations remains. The framework of
target trial emulation has emerged as a structured approach enabling the reproduction, from complex observational data, of the RCT protocol that would have answered the question of interest.
The statistical methods required to implement it remain an active field of research. The choice of causal estimand determines the various strategies for using the data; instrumental variables allow certain biases to be accounted for; federated learning enables the use of multiple sources under confidentiality constraints.
The overall objective of this thesis is to compare and apply causal inference approaches within the framework of target trial emulation. We will first rely on simulations of fictitious data to verify the performance of the proposed approaches in a controlled setting where the true effects are known, and then on practical applications using observational data from various sources.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Nature du financement
Contrat doctoral
Précisions sur le financement
Concours pour un contrat doctoral
Présentation établissement et labo d'accueil
Sorbonne Université SIS (Sciences, Ingénierie, Santé)
Etablissement délivrant le doctorat
Sorbonne Université SIS (Sciences, Ingénierie, Santé)
Ecole doctorale
393 Pierre Louis de Santé publique à Paris
Profil du candidat
MASTER EN BIOSTATISTIQUES ET/OU EPIDEMIOLOGIE, MASTER EN INGENIERIE STATISTIQUE ET/OU MATHEMATIQUES APPLIQUEES, ECOLE D'INGENIEUR STATISTIQUE OU GENERALISTE
MSC BIOSTATISTICS / EPIDEMIOLOGY / STATISTICS / APPLIED MATHEMATICS
MSC BIOSTATISTICS / EPIDEMIOLOGY / STATISTICS / APPLIED MATHEMATICS
12/06/2026
Postuler
Fermer
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
ANRT
Aérocentre, Pôle d'excellence régional
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
ADEME
Institut Sup'biotech de Paris
Tecknowmetrix
TotalEnergies
Nantes Université
Medicen Paris Region
ONERA - The French Aerospace Lab
Laboratoire National de Métrologie et d'Essais - LNE
SUEZ
Ifremer
Groupe AFNOR - Association française de normalisation
Généthon
Servier
Nokia Bell Labs France


