Où docteurs et entreprises se rencontrent
Menu
Connexion

Méthodes efficaces pour l'estimation de modèles spatio-temporels // Efficient methods for spatio-temporal models estimation

ABG-132134
ADUM-66223
Sujet de Thèse
22/05/2025
Mines Paris-PSL
Fontainebleau - Ile-de-France - France
Méthodes efficaces pour l'estimation de modèles spatio-temporels // Efficient methods for spatio-temporal models estimation
  • Electronique
statistique, machine learning, processus gaussien, statistique spatio-temporelle, apprentissage profond
statistics, machine learning, gaussian process, spatio-temporal statistics, deep learning

Description du sujet

La géostatistique vise à modéliser les phénomènes naturels qui évoluent dans l'espace et le temps et à prédire leur comportement à des endroits non observés, tout en quantifiant les incertitudes associées. La plupart des modèles géostatistiques reposent sur des processus gaussiens, car ils permettent de prédire facilement la variable d'intérêt à des moments/endroits non observés, ainsi que de calculer la variance de la prédiction. Dans ce contexte, les observations sont supposées provenir d'une réalisation particulière d'un processus gaussien dont les paramètres doivent être estimés. Le moment du second ordre, qui détermine la régularité du processus, est classiquement choisi parmi les familles paramétriques de fonctions de covariance. Leurs paramètres sont ensuite estimés en maximisant la vraisemblance des données. Ces dernières années, des modèles spatio-temporels sophistiqués basés sur des équations différentielles partielles stochastiques (EDPS) ont été proposés. Fondés sur une représentation stochastique de processus physiques tels que l'advection et la diffusion, ils permettent de modéliser les phénomènes spatio-temporels de manière plus naturelle que les modèles de covariance spatio-temporels standard. Leur flexibilité peut également être améliorée si l'on considère des extensions non stationnaires, c'est-à-dire lorsque la diffusion et l'advection varient dans l'espace et dans le temps.

Dans la pratique, toutefois, l'estimation du maximum de vraisemblance devient souvent un goulot d'étranglement informatique à mesure que la quantité de données augmente - un problème qui se pose fréquemment dans un contexte spatio-temporel. Il est donc très important de développer des techniques d'estimation applicables dans ce cadre. La discrétisation par éléments finis des EDPS permet d'obtenir une matrice de précision peu dense (covariance inverse) pour le champ aléatoire spatio-temporel. Cela accélère le calcul de la vraisemblance, mais le problème d'optimisation reste difficile, en particulier lorsque l'on considère des modèles non stationnaires.

Le projet de doctorat vise à relever les défis informatiques de l'inférence de modèles spatio-temporels complexes, en explorant différentes approches, parmi lesquelles la mise en œuvre dans un cadre informatique permettant la différenciation automatique, des méthodes d'inférence basées sur les simulations, ou toute autre approche que la/le candidat(e) pourrait proposer.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Geostatistics aims at modeling natural phenomena that evolve in space and time and predicting their behavior at unobserved locations, while quantifying the associated uncertainties. Most geostatistical models rely on Gaussian processes, as they allow for an easy prediction of the variable of interest at unobserved times/locations together with the computation of the prediction variance. In this context, the observations are assumed to be derived from a particular realization of a Gaussian process whose parameters have to be estimated. The second order moment, that shapes the regularity of the process, is classically chosen among parametric families of covariance functions. Their parameters are then estimated by maximizing the likelihood of the data. In the past few years, sophisticated spatio-temporal models based on stochastic partial differential equations (SPDEs) have been proposed. Built upon a stochastic representation of physical processes such as advection and diffusion, they allow for a more natural way to model spatio-temporal phenomena than standard spatio-temporal covariance models. Their flexibility can also be enhanced when considering nonstationary extensions, that is when diffusion and advection vary across space and time.

In practice, however, maximum likelihood estimation often becomes a computational bottleneck as the amount of data increases — an issue that frequently arises in a spatio-temporal context. It is therefore of major importance to develop scalable estimation techniques. The finite element discretization of the SPDEs yields a sparse precision matrix (inverse covariance) for the spatio-temporal random field. This speeds up the computation of the likelihood but the optimization problem remains hard, especially when considering non stationary models.

The PhD project aims to tackle the computational challenges of the inference of complex spatio-temporal models, exploring different approaches, among which the implementation within a computational framework allowing for automatic differentiation, simulation based inference methods, or any other approach the candidate may propose.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/10/2025

Nature du financement

Précisions sur le financement

Associations, fondations, programmes privés étrangers

Présentation établissement et labo d'accueil

Mines Paris-PSL

Etablissement délivrant le doctorat

Mines Paris-PSL

Ecole doctorale

621 ISMME - Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique

Profil du candidat

Le candidat doit être titulaire d'un master en ingénierie, mathématiques appliquées, informatique, statistiques ou science des données, avec des cours en apprentissage profond et/ou statistiques spatiales. Des compétences en programmation scientifique en Python sont requises, notamment avec des frameworks de Deep Learning (Pytorch, Tensorflow ou JAX).
The candidate should have a Master's degree in engineering, applied mathematics, computer science, statistics or data science, with courses in deep learning and/or spatial statistics. Proficient scientific programming skills in Python are required, especially with Deep Learning frameworks (Pytorch, Tensorflow or JAX).
13/07/2025
Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?