Méthodes d'inférence pour des données extrêmes dans un cadre univarié avec dépendance // Inference for extreme data in a univariate dependent setting
ABG-132773
ADUM-66839 |
Sujet de Thèse | |
04/07/2025 |
Université de Montpellier
MONTPELLIER CEDEX 5 - Occitanie - France
Méthodes d'inférence pour des données extrêmes dans un cadre univarié avec dépendance // Inference for extreme data in a univariate dependent setting
- Mathématiques
Théorie des valeurs extrêmes, Copules, Dépendance, estimation fréquentiste et bayésienne
Extreme value theory, Copula, Dependence, Frequentist and Bayesian estimation
Extreme value theory, Copula, Dependence, Frequentist and Bayesian estimation
Description du sujet
La théorie des valeurs extrêmes univariés assure que le maximum de variables aléatoires indépendantes et de même loi converge vers une loi GEV. L'hypothèse d'indépendance s'avère être un verrou dans de nombreuses applications, pour lesquelles les données sont corrélées dans le temps ou dans l'espace : hauteurs de vagues, températures successives, niveaux de pollution, rendements financiers journaliers, etc.
Dès les années 1970–80, des travaux fondateurs ont permis d'étendre certains résultats de convergence en introduisant des notions de dépendance asymptotique, suffisamment faibles pour garantir une forme de « quasi-indépendance » entre les événements extrêmes (voir Leadbetter (1974) et Leadbetter (1983)). Plus récemment, une approche plus flexible a émergé : celle des copules. Les copules permettent de modéliser séparément la dépendance entre variables et leur comportement marginal, en s'appuyant notamment sur le théorème de Sklar (1959). Cette méthode a profondément renouvelé la modélisation des extrêmes dépendants, en particulier dans un cadre multivarié. On renvoie à Nelsen (2006), Joe (2015), ou Durante et Sempi (2015).
La publication récente Herrmann, Hofert et Nešlehová (2024) présente un point de vue différent : elle établit les conditions de convergence du maximum dans un cadre général dépendant, basé sur les copules. Ce cadre théorique permet de généraliser le théorème de Fisher–Tippett–Gnedenko à des séquences de variables aléatoires dépendantes, en intégrant directement la structure de dépendance via une fonction limite.
Le projet de thèse vise à développer des techniques d'inférence fréquentiste et bayésienne pour estimer la loi limite du maximum sous des hypothèses de dépendance. Les méthodes bayésiennes sont particulièrement adaptées aux situations où l'information est rare ou incertaine - ce qui est typiquement le cas dans l'analyse des extrêmes, voir Beirlant et al. (2004, Chapitre 11) ou Bousquet & Bernardara (2021, Chapitre 11). En introduisant des distributions a priori souples sur les paramètres, on peut obtenir :
- des intervalles de crédibilité (plutôt que de simples intervalles de confiance),
- une prévision de densité pour les observations extrêmes,
- une meilleure prise en compte de la structure de dépendance, notamment dans des modèles échangeables, comme ceux évoqués dans Herrmann, Hofert \& Neslehova (2024).
La thèse visera ainsi à développer et à étudier des estimateurs ainsi qu'à évaluer leur performance sur des données simulées et réelles, par exemple météorologiques ou financières.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Univariate extreme value theory (EVT) states that the maximum of a sequence of independent, identically distributed random variables converges to a Generalized Extreme Value (GEV) distribution. However, the assumption of independence is often unrealistic in real-world applications, where data are typically temporally or spatially correlated - e.g., wave heights, temperature records, pollution levels, or financial returns.
Pioneering work by Leadbetter (1974, 1983) relaxed the independence assumption by introducing asymptotic dependence conditions, allowing a form of “quasi-independence” between extreme events. More recently, copula-based approaches have enabled the separate modeling of marginal behavior and dependence structure (Sklar, 1959), significantly advancing the field, especially in multivariate settings. We refer to Nelsen (2006), Joe (2015), or Durante and Sempi (2015) for textbook introductions.
A different point-of-view was proposed by Herrmann, Hofert, and Nešlehová (2024), who established convergence conditions for the maximum in a dependent univariate setting using copulas. This generalizes the Fisher-Tippett-Gnedenko theorem to sequences of dependent variables.
The aim of this thesis project is to develop frequentist and Bayesian inference techniques for estimating the limit distribution of the maximum under dependency assumptions. Bayesian methods are particularly suited to situations where information is scarce or uncertain - which is typically the case in the analysis of extremes, see Beirlant et al. (2004, Chapter 11) or Bousquet & Bernardara (2021, Chapter 11). By introducing flexible prior distributions on the parameters, we can obtain:
- credibility intervals (rather than simple confidence intervals),
- density prediction for extreme observations,
- better consideration of dependency structure, particularly in exchangeable models, such as those discussed in Herrmann, Hofert \& Nešlehová (2024).
The thesis will thus aim to develop and study estimators and evaluate their performance on simulated and real data, for example meteorological or financial data.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
Dès les années 1970–80, des travaux fondateurs ont permis d'étendre certains résultats de convergence en introduisant des notions de dépendance asymptotique, suffisamment faibles pour garantir une forme de « quasi-indépendance » entre les événements extrêmes (voir Leadbetter (1974) et Leadbetter (1983)). Plus récemment, une approche plus flexible a émergé : celle des copules. Les copules permettent de modéliser séparément la dépendance entre variables et leur comportement marginal, en s'appuyant notamment sur le théorème de Sklar (1959). Cette méthode a profondément renouvelé la modélisation des extrêmes dépendants, en particulier dans un cadre multivarié. On renvoie à Nelsen (2006), Joe (2015), ou Durante et Sempi (2015).
La publication récente Herrmann, Hofert et Nešlehová (2024) présente un point de vue différent : elle établit les conditions de convergence du maximum dans un cadre général dépendant, basé sur les copules. Ce cadre théorique permet de généraliser le théorème de Fisher–Tippett–Gnedenko à des séquences de variables aléatoires dépendantes, en intégrant directement la structure de dépendance via une fonction limite.
Le projet de thèse vise à développer des techniques d'inférence fréquentiste et bayésienne pour estimer la loi limite du maximum sous des hypothèses de dépendance. Les méthodes bayésiennes sont particulièrement adaptées aux situations où l'information est rare ou incertaine - ce qui est typiquement le cas dans l'analyse des extrêmes, voir Beirlant et al. (2004, Chapitre 11) ou Bousquet & Bernardara (2021, Chapitre 11). En introduisant des distributions a priori souples sur les paramètres, on peut obtenir :
- des intervalles de crédibilité (plutôt que de simples intervalles de confiance),
- une prévision de densité pour les observations extrêmes,
- une meilleure prise en compte de la structure de dépendance, notamment dans des modèles échangeables, comme ceux évoqués dans Herrmann, Hofert \& Neslehova (2024).
La thèse visera ainsi à développer et à étudier des estimateurs ainsi qu'à évaluer leur performance sur des données simulées et réelles, par exemple météorologiques ou financières.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Univariate extreme value theory (EVT) states that the maximum of a sequence of independent, identically distributed random variables converges to a Generalized Extreme Value (GEV) distribution. However, the assumption of independence is often unrealistic in real-world applications, where data are typically temporally or spatially correlated - e.g., wave heights, temperature records, pollution levels, or financial returns.
Pioneering work by Leadbetter (1974, 1983) relaxed the independence assumption by introducing asymptotic dependence conditions, allowing a form of “quasi-independence” between extreme events. More recently, copula-based approaches have enabled the separate modeling of marginal behavior and dependence structure (Sklar, 1959), significantly advancing the field, especially in multivariate settings. We refer to Nelsen (2006), Joe (2015), or Durante and Sempi (2015) for textbook introductions.
A different point-of-view was proposed by Herrmann, Hofert, and Nešlehová (2024), who established convergence conditions for the maximum in a dependent univariate setting using copulas. This generalizes the Fisher-Tippett-Gnedenko theorem to sequences of dependent variables.
The aim of this thesis project is to develop frequentist and Bayesian inference techniques for estimating the limit distribution of the maximum under dependency assumptions. Bayesian methods are particularly suited to situations where information is scarce or uncertain - which is typically the case in the analysis of extremes, see Beirlant et al. (2004, Chapter 11) or Bousquet & Bernardara (2021, Chapter 11). By introducing flexible prior distributions on the parameters, we can obtain:
- credibility intervals (rather than simple confidence intervals),
- density prediction for extreme observations,
- better consideration of dependency structure, particularly in exchangeable models, such as those discussed in Herrmann, Hofert \& Nešlehová (2024).
The thesis will thus aim to develop and study estimators and evaluate their performance on simulated and real data, for example meteorological or financial data.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
Nature du financement
Précisions sur le financement
Financement d'un établissement public Français
Présentation établissement et labo d'accueil
Université de Montpellier
Etablissement délivrant le doctorat
Université de Montpellier
Ecole doctorale
166 I2S - Information, Structures, Systèmes
Profil du candidat
Titulaire d'un M2 ou d'un diplôme d'ingénieur en statistique.
Solides connaissances en mathématiques, notamment en statistiques et en théorie des probabilités, maîtrise de la programmation R et/ou Python.
M2 or engineering degree in statistics. Strong background in mathematics, particularly statistics and probability theory, proficiency in R and/or Python programming
M2 or engineering degree in statistics. Strong background in mathematics, particularly statistics and probability theory, proficiency in R and/or Python programming
07/09/2025
Postuler
Fermer
Vous avez déjà un compte ?
Nouvel utilisateur ?
Besoin d'informations sur l'ABG ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
MabDesign
ADEME
CASDEN
MabDesign
ONERA - The French Aerospace Lab
ANRT
Tecknowmetrix
TotalEnergies
Nokia Bell Labs France
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Généthon
Laboratoire National de Métrologie et d'Essais - LNE
PhDOOC
Institut Sup'biotech de Paris
CESI
Ifremer
SUEZ
Groupe AFNOR - Association française de normalisation
Aérocentre, Pôle d'excellence régional
-
EmploiRef. 132696Montreal, CanadaMcGill University
Post-doctoral position in medicinal chemistry
Expertises scientifiques :Chimie - Biochimie
Niveau d’expérience :Junior
-
EmploiRef. 132742Genève, SuisseEPSU
Professeur de Biologie UP à Genève
Expertises scientifiques :Biologie - Biochimie - Chimie
Niveau d’expérience :Confirmé