Méthodes efficaces pour l'estimation de modèles spatio-temporels // Efficient methods for spatio-temporal models estimation
ABG-132134
ADUM-66223 |
Sujet de Thèse | |
22/05/2025 |
Mines Paris-PSL
Fontainebleau - Ile-de-France - France
Méthodes efficaces pour l'estimation de modèles spatio-temporels // Efficient methods for spatio-temporal models estimation
- Electronique
statistique, machine learning, processus gaussien, statistique spatio-temporelle, apprentissage profond
statistics, machine learning, gaussian process, spatio-temporal statistics, deep learning
statistics, machine learning, gaussian process, spatio-temporal statistics, deep learning
Description du sujet
La géostatistique vise à modéliser les phénomènes naturels qui évoluent dans l'espace et le temps et à prédire leur comportement à des endroits non observés, tout en quantifiant les incertitudes associées. La plupart des modèles géostatistiques reposent sur des processus gaussiens, car ils permettent de prédire facilement la variable d'intérêt à des moments/endroits non observés, ainsi que de calculer la variance de la prédiction. Dans ce contexte, les observations sont supposées provenir d'une réalisation particulière d'un processus gaussien dont les paramètres doivent être estimés. Le moment du second ordre, qui détermine la régularité du processus, est classiquement choisi parmi les familles paramétriques de fonctions de covariance. Leurs paramètres sont ensuite estimés en maximisant la vraisemblance des données. Ces dernières années, des modèles spatio-temporels sophistiqués basés sur des équations différentielles partielles stochastiques (EDPS) ont été proposés. Fondés sur une représentation stochastique de processus physiques tels que l'advection et la diffusion, ils permettent de modéliser les phénomènes spatio-temporels de manière plus naturelle que les modèles de covariance spatio-temporels standard. Leur flexibilité peut également être améliorée si l'on considère des extensions non stationnaires, c'est-à-dire lorsque la diffusion et l'advection varient dans l'espace et dans le temps.
Dans la pratique, toutefois, l'estimation du maximum de vraisemblance devient souvent un goulot d'étranglement informatique à mesure que la quantité de données augmente - un problème qui se pose fréquemment dans un contexte spatio-temporel. Il est donc très important de développer des techniques d'estimation applicables dans ce cadre. La discrétisation par éléments finis des EDPS permet d'obtenir une matrice de précision peu dense (covariance inverse) pour le champ aléatoire spatio-temporel. Cela accélère le calcul de la vraisemblance, mais le problème d'optimisation reste difficile, en particulier lorsque l'on considère des modèles non stationnaires.
Le projet de doctorat vise à relever les défis informatiques de l'inférence de modèles spatio-temporels complexes, en explorant différentes approches, parmi lesquelles la mise en œuvre dans un cadre informatique permettant la différenciation automatique, des méthodes d'inférence basées sur les simulations, ou toute autre approche que la/le candidat(e) pourrait proposer.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Geostatistics aims at modeling natural phenomena that evolve in space and time and predicting their behavior at unobserved locations, while quantifying the associated uncertainties. Most geostatistical models rely on Gaussian processes, as they allow for an easy prediction of the variable of interest at unobserved times/locations together with the computation of the prediction variance. In this context, the observations are assumed to be derived from a particular realization of a Gaussian process whose parameters have to be estimated. The second order moment, that shapes the regularity of the process, is classically chosen among parametric families of covariance functions. Their parameters are then estimated by maximizing the likelihood of the data. In the past few years, sophisticated spatio-temporal models based on stochastic partial differential equations (SPDEs) have been proposed. Built upon a stochastic representation of physical processes such as advection and diffusion, they allow for a more natural way to model spatio-temporal phenomena than standard spatio-temporal covariance models. Their flexibility can also be enhanced when considering nonstationary extensions, that is when diffusion and advection vary across space and time.
In practice, however, maximum likelihood estimation often becomes a computational bottleneck as the amount of data increases — an issue that frequently arises in a spatio-temporal context. It is therefore of major importance to develop scalable estimation techniques. The finite element discretization of the SPDEs yields a sparse precision matrix (inverse covariance) for the spatio-temporal random field. This speeds up the computation of the likelihood but the optimization problem remains hard, especially when considering non stationary models.
The PhD project aims to tackle the computational challenges of the inference of complex spatio-temporal models, exploring different approaches, among which the implementation within a computational framework allowing for automatic differentiation, simulation based inference methods, or any other approach the candidate may propose.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
Dans la pratique, toutefois, l'estimation du maximum de vraisemblance devient souvent un goulot d'étranglement informatique à mesure que la quantité de données augmente - un problème qui se pose fréquemment dans un contexte spatio-temporel. Il est donc très important de développer des techniques d'estimation applicables dans ce cadre. La discrétisation par éléments finis des EDPS permet d'obtenir une matrice de précision peu dense (covariance inverse) pour le champ aléatoire spatio-temporel. Cela accélère le calcul de la vraisemblance, mais le problème d'optimisation reste difficile, en particulier lorsque l'on considère des modèles non stationnaires.
Le projet de doctorat vise à relever les défis informatiques de l'inférence de modèles spatio-temporels complexes, en explorant différentes approches, parmi lesquelles la mise en œuvre dans un cadre informatique permettant la différenciation automatique, des méthodes d'inférence basées sur les simulations, ou toute autre approche que la/le candidat(e) pourrait proposer.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Geostatistics aims at modeling natural phenomena that evolve in space and time and predicting their behavior at unobserved locations, while quantifying the associated uncertainties. Most geostatistical models rely on Gaussian processes, as they allow for an easy prediction of the variable of interest at unobserved times/locations together with the computation of the prediction variance. In this context, the observations are assumed to be derived from a particular realization of a Gaussian process whose parameters have to be estimated. The second order moment, that shapes the regularity of the process, is classically chosen among parametric families of covariance functions. Their parameters are then estimated by maximizing the likelihood of the data. In the past few years, sophisticated spatio-temporal models based on stochastic partial differential equations (SPDEs) have been proposed. Built upon a stochastic representation of physical processes such as advection and diffusion, they allow for a more natural way to model spatio-temporal phenomena than standard spatio-temporal covariance models. Their flexibility can also be enhanced when considering nonstationary extensions, that is when diffusion and advection vary across space and time.
In practice, however, maximum likelihood estimation often becomes a computational bottleneck as the amount of data increases — an issue that frequently arises in a spatio-temporal context. It is therefore of major importance to develop scalable estimation techniques. The finite element discretization of the SPDEs yields a sparse precision matrix (inverse covariance) for the spatio-temporal random field. This speeds up the computation of the likelihood but the optimization problem remains hard, especially when considering non stationary models.
The PhD project aims to tackle the computational challenges of the inference of complex spatio-temporal models, exploring different approaches, among which the implementation within a computational framework allowing for automatic differentiation, simulation based inference methods, or any other approach the candidate may propose.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
Nature du financement
Précisions sur le financement
Associations, fondations, programmes privés étrangers
Présentation établissement et labo d'accueil
Mines Paris-PSL
Etablissement délivrant le doctorat
Mines Paris-PSL
Ecole doctorale
621 ISMME - Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique
Profil du candidat
Le candidat doit être titulaire d'un master en ingénierie, mathématiques appliquées, informatique, statistiques ou science des données, avec des cours en apprentissage profond et/ou statistiques spatiales. Des compétences en programmation scientifique en Python sont requises, notamment avec des frameworks de Deep Learning (Pytorch, Tensorflow ou JAX).
The candidate should have a Master's degree in engineering, applied mathematics, computer science, statistics or data science, with courses in deep learning and/or spatial statistics. Proficient scientific programming skills in Python are required, especially with Deep Learning frameworks (Pytorch, Tensorflow or JAX).
The candidate should have a Master's degree in engineering, applied mathematics, computer science, statistics or data science, with courses in deep learning and/or spatial statistics. Proficient scientific programming skills in Python are required, especially with Deep Learning frameworks (Pytorch, Tensorflow or JAX).
13/07/2025
Postuler
Fermer
Vous avez déjà un compte ?
Nouvel utilisateur ?
Besoin d'informations sur l'ABG ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
MabDesign
SUEZ
Nokia Bell Labs France
Institut Sup'biotech de Paris
Aérocentre, Pôle d'excellence régional
CASDEN
Laboratoire National de Métrologie et d'Essais - LNE
Tecknowmetrix
MabDesign
Groupe AFNOR - Association française de normalisation
ADEME
TotalEnergies
PhDOOC
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Ifremer
Généthon
ONERA - The French Aerospace Lab
ANRT
CESI