IA pour l'identification d'interactions entre variables, application à l'effet individuel d'un traitement // AI for identifying features interaction, application to individual treatment effect
|
ABG-136706
ADUM-72009 |
Sujet de Thèse | |
| 14/03/2026 |
Université de Lorraine
VANDOEUVRE LES NANCY - Grand Est - France
IA pour l'identification d'interactions entre variables, application à l'effet individuel d'un traitement // AI for identifying features interaction, application to individual treatment effect
apprentissage statistique, interactions, Arbre Cart, Random Forest, médecine de précision, effet individuel de traitement
statistical learning, interactions, Cart Tree, Random Forest, personalised medicine, Individual treatment effect
statistical learning, interactions, Cart Tree, Random Forest, personalised medicine, Individual treatment effect
Description du sujet
La sélection de variables est un domaine de recherche très actif en statistique et en apprentissage automatique depuis les années 2000, avec le développement de nombreuses méthodes. Elle revêt une importance capitale pour l'interprétation des modèles et des algorithmes décisionnels. Cependant, la sélection de variables seule ne suffit pas pour l'interprétation ; il est également essentiel d'identifier et de comprendre les interactions entre les variables.
Dans ce projet, nous proposons un nouveau cadre basé sur des modèles d'apprentissage automatique pour découvrir et quantifier les interactions entre les covariables. Les forêts aléatoires (RF) sont particulièrement bien adaptées à cet effet. Une partie de la littérature se concentre sur des interactions plus ciblées, en particulier lorsqu'une des variables est binaire (par exemple, traitement vs placebo en médecine personnalisée, pour identifier les effets différentiels du traitement (ITE)). Dans cette thèse, nous aborderons les deux scénarios.
Cette thèse est méthodologique et vise à développer des méthodes générales applicables à divers domaines (d'où sa soumission sous le thème « IA pour la découverte scientifique »), bien que notre approche s'appuie sur des exemples biologiques et cliniques, tels que des questions de diagnostic et de médecine personnalisée en cardiologie. Nous travaillerons avec de grandes bases de données cardiovasculaires, tant observationnelles que randomisées.
Les résultats de cette thèse seront largement applicables à l'ensemble de la communauté analytique, au-delà de la recherche en santé et biomédicale.
Outre des publications dans des revues spécialisées en apprentissage statistique ou d'études cliniques, nous développerons des paquets pour les logiciel R ou Python.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Variable selection is a highly active research field in statistics and machine learning since the 2000s, with the development of numerous methods. It is of paramount importance for the interpretation of models and decision-making algorithms. However, variable selection alone is not sufficient for interpretation; it is also essential to identify and understand interactions between variables.
In this project, we propose a new framework based on machine learning models to discover and quantify interactions between covariates. Random forests (RF) are particularly well suited for this purpose. A body of literature focuses on more targeted interactions, particularly when one of the variables is binary (e.g., treatment vs. placebo in personalized medicine, to identify differential treatment effects (ITE)). In this thesis, we will address both scenarios.
This thesis is methodological, aiming to develop general methods applicable to various fields (hence the submission under the theme 'AI for Scientific Discovery'), although our approach is guided by biological and clinical examples, such as diagnostic and personalized medicine questions in cardiology. We will work with large cardiovascular databases, both observational or and randomized.
The outputs of this PhD will be broadly applicable across the analytic community, beyond health and biomedical research.
In addition to publications in statistical learning journals and applications in clinical studies, we will develop software packages for R or Python.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Dans ce projet, nous proposons un nouveau cadre basé sur des modèles d'apprentissage automatique pour découvrir et quantifier les interactions entre les covariables. Les forêts aléatoires (RF) sont particulièrement bien adaptées à cet effet. Une partie de la littérature se concentre sur des interactions plus ciblées, en particulier lorsqu'une des variables est binaire (par exemple, traitement vs placebo en médecine personnalisée, pour identifier les effets différentiels du traitement (ITE)). Dans cette thèse, nous aborderons les deux scénarios.
Cette thèse est méthodologique et vise à développer des méthodes générales applicables à divers domaines (d'où sa soumission sous le thème « IA pour la découverte scientifique »), bien que notre approche s'appuie sur des exemples biologiques et cliniques, tels que des questions de diagnostic et de médecine personnalisée en cardiologie. Nous travaillerons avec de grandes bases de données cardiovasculaires, tant observationnelles que randomisées.
Les résultats de cette thèse seront largement applicables à l'ensemble de la communauté analytique, au-delà de la recherche en santé et biomédicale.
Outre des publications dans des revues spécialisées en apprentissage statistique ou d'études cliniques, nous développerons des paquets pour les logiciel R ou Python.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Variable selection is a highly active research field in statistics and machine learning since the 2000s, with the development of numerous methods. It is of paramount importance for the interpretation of models and decision-making algorithms. However, variable selection alone is not sufficient for interpretation; it is also essential to identify and understand interactions between variables.
In this project, we propose a new framework based on machine learning models to discover and quantify interactions between covariates. Random forests (RF) are particularly well suited for this purpose. A body of literature focuses on more targeted interactions, particularly when one of the variables is binary (e.g., treatment vs. placebo in personalized medicine, to identify differential treatment effects (ITE)). In this thesis, we will address both scenarios.
This thesis is methodological, aiming to develop general methods applicable to various fields (hence the submission under the theme 'AI for Scientific Discovery'), although our approach is guided by biological and clinical examples, such as diagnostic and personalized medicine questions in cardiology. We will work with large cardiovascular databases, both observational or and randomized.
The outputs of this PhD will be broadly applicable across the analytic community, beyond health and biomedical research.
In addition to publications in statistical learning journals and applications in clinical studies, we will develop software packages for R or Python.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Nature du financement
Précisions sur le financement
Plan Investissement d'Avenir (Idex, Labex)
Présentation établissement et labo d'accueil
Université de Lorraine
Etablissement délivrant le doctorat
Université de Lorraine
Ecole doctorale
77 IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES
Profil du candidat
L'étudiant doit être titulaire d'un master ou avoir un titre d'ingénieur en mathématiques appliquées ou en science des données et être motivé par les applications dans le domaine de la santé.
Students must hold a master's degree or an engineering degree in applied mathematics or data science and be motivated by applications in the field of health.
Students must hold a master's degree or an engineering degree in applied mathematics or data science and be motivated by applications in the field of health.
19/04/2026
Postuler
Fermer
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
SUEZ
Généthon
Laboratoire National de Métrologie et d'Essais - LNE
Aérocentre, Pôle d'excellence régional
Groupe AFNOR - Association française de normalisation
Nokia Bell Labs France
ADEME
Servier
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Institut Sup'biotech de Paris
ONERA - The French Aerospace Lab
TotalEnergies
ANRT
Medicen Paris Region
Nantes Université
Ifremer
Tecknowmetrix
-
EmploiRef. 136129Nouméa , Territoires d'Outre-Mer , France
IFREMERResponsable Scientifique d'Unité Responsable de la Délégation de la Nouvelle Calédonie H/F
Expertises scientifiques :Ecologie, environnement
Niveau d’expérience :Niveau d'expérience indifférent
-
EmploiRef. 136697Paris , Ile-de-France , France
Association Bernard Gregory ABGAnimateur.rice / Formateur.rice
Expertises scientifiques :Indifférent
Niveau d’expérience :Niveau d'expérience indifférent
