Où docteurs et entreprises se rencontrent
Menu
Connexion

IA pour l'identification d'interactions entre variables, application à l'effet individuel d'un traitement // AI for identifying features interaction, application to individual treatment effect

ABG-136706
ADUM-72009
Sujet de Thèse
14/03/2026
Université de Lorraine
VANDOEUVRE LES NANCY - Grand Est - France
IA pour l'identification d'interactions entre variables, application à l'effet individuel d'un traitement // AI for identifying features interaction, application to individual treatment effect
apprentissage statistique, interactions, Arbre Cart, Random Forest, médecine de précision, effet individuel de traitement
statistical learning, interactions, Cart Tree, Random Forest, personalised medicine, Individual treatment effect

Description du sujet

La sélection de variables est un domaine de recherche très actif en statistique et en apprentissage automatique depuis les années 2000, avec le développement de nombreuses méthodes. Elle revêt une importance capitale pour l'interprétation des modèles et des algorithmes décisionnels. Cependant, la sélection de variables seule ne suffit pas pour l'interprétation ; il est également essentiel d'identifier et de comprendre les interactions entre les variables.
Dans ce projet, nous proposons un nouveau cadre basé sur des modèles d'apprentissage automatique pour découvrir et quantifier les interactions entre les covariables. Les forêts aléatoires (RF) sont particulièrement bien adaptées à cet effet. Une partie de la littérature se concentre sur des interactions plus ciblées, en particulier lorsqu'une des variables est binaire (par exemple, traitement vs placebo en médecine personnalisée, pour identifier les effets différentiels du traitement (ITE)). Dans cette thèse, nous aborderons les deux scénarios.
Cette thèse est méthodologique et vise à développer des méthodes générales applicables à divers domaines (d'où sa soumission sous le thème « IA pour la découverte scientifique »), bien que notre approche s'appuie sur des exemples biologiques et cliniques, tels que des questions de diagnostic et de médecine personnalisée en cardiologie. Nous travaillerons avec de grandes bases de données cardiovasculaires, tant observationnelles que randomisées.
Les résultats de cette thèse seront largement applicables à l'ensemble de la communauté analytique, au-delà de la recherche en santé et biomédicale.
Outre des publications dans des revues spécialisées en apprentissage statistique ou d'études cliniques, nous développerons des paquets pour les logiciel R ou Python.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Variable selection is a highly active research field in statistics and machine learning since the 2000s, with the development of numerous methods. It is of paramount importance for the interpretation of models and decision-making algorithms. However, variable selection alone is not sufficient for interpretation; it is also essential to identify and understand interactions between variables.
In this project, we propose a new framework based on machine learning models to discover and quantify interactions between covariates. Random forests (RF) are particularly well suited for this purpose. A body of literature focuses on more targeted interactions, particularly when one of the variables is binary (e.g., treatment vs. placebo in personalized medicine, to identify differential treatment effects (ITE)). In this thesis, we will address both scenarios.
This thesis is methodological, aiming to develop general methods applicable to various fields (hence the submission under the theme 'AI for Scientific Discovery'), although our approach is guided by biological and clinical examples, such as diagnostic and personalized medicine questions in cardiology. We will work with large cardiovascular databases, both observational or and randomized.
The outputs of this PhD will be broadly applicable across the analytic community, beyond health and biomedical research.
In addition to publications in statistical learning journals and applications in clinical studies, we will develop software packages for R or Python.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/10/2026

Nature du financement

Précisions sur le financement

Plan Investissement d'Avenir (Idex, Labex)

Présentation établissement et labo d'accueil

Université de Lorraine

Etablissement délivrant le doctorat

Université de Lorraine

Ecole doctorale

77 IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES

Profil du candidat

L'étudiant doit être titulaire d'un master ou avoir un titre d'ingénieur en mathématiques appliquées ou en science des données et être motivé par les applications dans le domaine de la santé.
Students must hold a master's degree or an engineering degree in applied mathematics or data science and be motivated by applications in the field of health.
19/04/2026
Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?