Nouvelles stratégies d'estimation non-paramétrique dans les modèles de guérison. // New nonparametric estimation strategies in cure models
|
ABG-137722
ADUM-72535 |
Sujet de Thèse | |
| 04/04/2026 | Contrat doctoral |
Université de Montpellier
MONTPELLIER CEDEX 5 - Occitanie - France
Nouvelles stratégies d'estimation non-paramétrique dans les modèles de guérison. // New nonparametric estimation strategies in cure models
- Mathématiques
analyse de survie, applications cliniques, estimation non-paramétrique, asthme, modèles de guérison, répondeurs cliniques
survival analysis, clinical applications, nonparametric estimation, asthma, cure models, clinical responders
survival analysis, clinical applications, nonparametric estimation, asthma, cure models, clinical responders
Description du sujet
Dans un contexte marqué par l'augmentation des maladies chroniques, la recherche clinique joue un rôle central dans l'évaluation des interventions médicales et des facteurs influençant la santé des individus. Les méthodes statistiques d'analyse de survie, qui consistent à étudier le temps jusqu'à la survenue d'un événement d'intérêt, comme une rechute, sont devenues incontournables. Elle permettent d'analyser l'effet de traitements, de caractéristiques individuelles ou de modes de vie sur l'évolution des patients.
L'analyse de survie repose généralement sur l'hypothèse que tous les individus finiront par présenter l'événement étudié, même si celui-ci n'est pas observé durant la période de suivi. Toutefois, cette hypothèse est souvent irréaliste, car certains patients peuvent ne jamais présenter cet événement. Ces individus sont alors considérés comme guéris ou immunisés, ce qui implique un temps de survenue théoriquement infini. Pour prendre en compte ceci, des modèles spécifiques appelés modèles de guérison ont été développés. Ils permettent de distinguer deux sous-populations : les individus susceptibles de présenter l'événement et ceux qui ne le présenteront jamais. L'intérêt principal de ces modèles est de pouvoir estimer à la fois la probabilité de guérison et la dynamique de survie des individus non guéris, tout en évaluant l'influence de différents facteurs explicatifs. Ils reposent sur une approche de mélange probabiliste séparant la population en deux groupes latents. Les approches classiques utilisent des modèles paramétriques ou semi-paramétriques, mais des méthodes non paramétriques ont également été proposées afin d'offrir davantage de flexibilité face à la complexité des données cliniques.
Le premier objectif du projet est de développer une nouvelle méthode d'estimation non-paramétrique de type moindres carrés de la fonction de risque dans le cadre des modèles de guérison. Cette méthode vise à proposer des estimateurs flexibles, adaptés aux données, et présentant des propriétés statistiques optimales (vitesses de convergence optimale, sélection adaptative des paramètres). Elle sera étudiée tout d'abord introduite dans des contextes simples, puis en présence de variables explicatives.
Le second objectif consiste à intégrer une approche d'inférence causale afin d'évaluer l'effet des traitements sur la survie des patients. L'accent sera mis sur l'utilisation du Restricted Mean Survival Time (RMST), un indicateur permettant de mesurer de manière directe et interprétable le bénéfice clinique d'une intervention sur une période donnée, en comparaison avec les approches classiques basées sur les risques.
Le nouvel estimateur sera ensuite implémenté et appliqué à la fois sur des données simulées et sur des données réelles de patients asthmatiques présents dans les deux cohortes COBRA et RAMSES. Les performances empiriques seront évaluées et comparées aux approches existantes issues de la littérature. Le projet de thèse bénéficiera de la collaboration avec l'Institut Debrest d'Epidémiologie et de Santé Publique (IDESP) qui a une expertise sur ces deux bases de données et avec l'équipe PhyMedEXP UMR INSERM 1046 pour l'expertise clinique.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
With the increasing prevalence of chronic diseases, clinical research plays a central role in evaluating medical interventions and the factors influencing individual health. Survival analysis methods, which study the time until the occurrence of an event of interest, such as relapse, have become essential. They allow for the assessment of the effects of treatments, individual characteristics, or lifestyle factors on patient outcomes.
Survival analysis generally relies on the assumption that all individuals will eventually experience the event under study, even if it is not observed during the follow-up period. However, this assumption is often unrealistic, as some patients may never experience the event. These individuals are then considered cured or immune, implying an infinite time to event.To take this into account, specific models known as cure models have been developed. These models distinguish between two subpopulations: individuals who are susceptible to the event and those who will never experience it. The main advantage of these models is that they allow for the estimation of both the probability of cure and the survival dynamics of non-cured individuals, while also evaluating the influence of various explanatory factors. They rely on a probabilistic mixture that separates the population into two latent groups. Classical approaches use parametric or semi-parametric models, but nonparametric methods have also been proposed to provide greater flexibility in handling the complexity of clinical data.
The first objective of the project is to develop a new nonparametric least-squares estimation method for the hazard function within the framework of cure models. This method aims to provide flexible, data-adaptive estimators with optimal statistical properties (optimal convergence rates and adaptive model selection). It will first be studied in simple settings, and then extended to include explanatory variables.
The second objective is to incorporate a causal inference approach to evaluate the effect of treatments on patient survival. The focus will be on the use of the Restricted Mean Survival Time (RMST), an indicator that directly and interpretably measures the clinical benefit of an intervention over a given period, compared with classical approaches based on hazard rate ratios.
The new estimator will then be implemented and applied to both simulated data and real-world data from severe asthmatic patients included in the COBRA and RAMSES cohorts. Empirical performance will be evaluated and compared with existing approaches from the literature. The thesis project will benefit from collaboration with the Institut Desbrest of Epidemiology and Public Health (IDESP), which has expertise in these databases, and the PhyMedExp team (UMR INSERM 1046) for clinical expertise.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
L'analyse de survie repose généralement sur l'hypothèse que tous les individus finiront par présenter l'événement étudié, même si celui-ci n'est pas observé durant la période de suivi. Toutefois, cette hypothèse est souvent irréaliste, car certains patients peuvent ne jamais présenter cet événement. Ces individus sont alors considérés comme guéris ou immunisés, ce qui implique un temps de survenue théoriquement infini. Pour prendre en compte ceci, des modèles spécifiques appelés modèles de guérison ont été développés. Ils permettent de distinguer deux sous-populations : les individus susceptibles de présenter l'événement et ceux qui ne le présenteront jamais. L'intérêt principal de ces modèles est de pouvoir estimer à la fois la probabilité de guérison et la dynamique de survie des individus non guéris, tout en évaluant l'influence de différents facteurs explicatifs. Ils reposent sur une approche de mélange probabiliste séparant la population en deux groupes latents. Les approches classiques utilisent des modèles paramétriques ou semi-paramétriques, mais des méthodes non paramétriques ont également été proposées afin d'offrir davantage de flexibilité face à la complexité des données cliniques.
Le premier objectif du projet est de développer une nouvelle méthode d'estimation non-paramétrique de type moindres carrés de la fonction de risque dans le cadre des modèles de guérison. Cette méthode vise à proposer des estimateurs flexibles, adaptés aux données, et présentant des propriétés statistiques optimales (vitesses de convergence optimale, sélection adaptative des paramètres). Elle sera étudiée tout d'abord introduite dans des contextes simples, puis en présence de variables explicatives.
Le second objectif consiste à intégrer une approche d'inférence causale afin d'évaluer l'effet des traitements sur la survie des patients. L'accent sera mis sur l'utilisation du Restricted Mean Survival Time (RMST), un indicateur permettant de mesurer de manière directe et interprétable le bénéfice clinique d'une intervention sur une période donnée, en comparaison avec les approches classiques basées sur les risques.
Le nouvel estimateur sera ensuite implémenté et appliqué à la fois sur des données simulées et sur des données réelles de patients asthmatiques présents dans les deux cohortes COBRA et RAMSES. Les performances empiriques seront évaluées et comparées aux approches existantes issues de la littérature. Le projet de thèse bénéficiera de la collaboration avec l'Institut Debrest d'Epidémiologie et de Santé Publique (IDESP) qui a une expertise sur ces deux bases de données et avec l'équipe PhyMedEXP UMR INSERM 1046 pour l'expertise clinique.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
With the increasing prevalence of chronic diseases, clinical research plays a central role in evaluating medical interventions and the factors influencing individual health. Survival analysis methods, which study the time until the occurrence of an event of interest, such as relapse, have become essential. They allow for the assessment of the effects of treatments, individual characteristics, or lifestyle factors on patient outcomes.
Survival analysis generally relies on the assumption that all individuals will eventually experience the event under study, even if it is not observed during the follow-up period. However, this assumption is often unrealistic, as some patients may never experience the event. These individuals are then considered cured or immune, implying an infinite time to event.To take this into account, specific models known as cure models have been developed. These models distinguish between two subpopulations: individuals who are susceptible to the event and those who will never experience it. The main advantage of these models is that they allow for the estimation of both the probability of cure and the survival dynamics of non-cured individuals, while also evaluating the influence of various explanatory factors. They rely on a probabilistic mixture that separates the population into two latent groups. Classical approaches use parametric or semi-parametric models, but nonparametric methods have also been proposed to provide greater flexibility in handling the complexity of clinical data.
The first objective of the project is to develop a new nonparametric least-squares estimation method for the hazard function within the framework of cure models. This method aims to provide flexible, data-adaptive estimators with optimal statistical properties (optimal convergence rates and adaptive model selection). It will first be studied in simple settings, and then extended to include explanatory variables.
The second objective is to incorporate a causal inference approach to evaluate the effect of treatments on patient survival. The focus will be on the use of the Restricted Mean Survival Time (RMST), an indicator that directly and interpretably measures the clinical benefit of an intervention over a given period, compared with classical approaches based on hazard rate ratios.
The new estimator will then be implemented and applied to both simulated data and real-world data from severe asthmatic patients included in the COBRA and RAMSES cohorts. Empirical performance will be evaluated and compared with existing approaches from the literature. The thesis project will benefit from collaboration with the Institut Desbrest of Epidemiology and Public Health (IDESP), which has expertise in these databases, and the PhyMedExp team (UMR INSERM 1046) for clinical expertise.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Nature du financement
Contrat doctoral
Précisions sur le financement
Concours pour un contrat doctoral
Présentation établissement et labo d'accueil
Université de Montpellier
Etablissement délivrant le doctorat
Université de Montpellier
Ecole doctorale
166 I2S - Information, Structures, Systèmes
Profil du candidat
- Master mathématiques appliquées, statistique ou équivalent avec une solide formation en mathématiques.
- Intérêt pour l'application de méthodes statistiques aux données biomédicales
- Expérience avec les langages R et/ou Python
- MSc or Engineer student in Applied Mathematics or Statistics, with a very good mathematical background - Interest in applying recent statistical methods to biomedical data. - Experience with R and/or Python programming languages.
- MSc or Engineer student in Applied Mathematics or Statistics, with a very good mathematical background - Interest in applying recent statistical methods to biomedical data. - Experience with R and/or Python programming languages.
04/05/2026
Postuler
Fermer
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
Ifremer
TotalEnergies
ADEME
Tecknowmetrix
Servier
Nokia Bell Labs France
Aérocentre, Pôle d'excellence régional
Nantes Université
Groupe AFNOR - Association française de normalisation
ANRT
Institut Sup'biotech de Paris
SUEZ
Laboratoire National de Métrologie et d'Essais - LNE
Medicen Paris Region
Généthon
ONERA - The French Aerospace Lab
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
