Where PhDs and companies meet
Menu
Login

Méthodes d'inférence pour des données extrêmes dans un cadre univarié avec dépendance // Inference for extreme data in a univariate dependent setting

ABG-132773
ADUM-66839
Thesis topic
2025-07-04
Université de Montpellier
MONTPELLIER CEDEX 5 - Occitanie - France
Méthodes d'inférence pour des données extrêmes dans un cadre univarié avec dépendance // Inference for extreme data in a univariate dependent setting
  • Mathematics
Théorie des valeurs extrêmes, Copules, Dépendance, estimation fréquentiste et bayésienne
Extreme value theory, Copula, Dependence, Frequentist and Bayesian estimation

Topic description

La théorie des valeurs extrêmes univariés assure que le maximum de variables aléatoires indépendantes et de même loi converge vers une loi GEV. L'hypothèse d'indépendance s'avère être un verrou dans de nombreuses applications, pour lesquelles les données sont corrélées dans le temps ou dans l'espace : hauteurs de vagues, températures successives, niveaux de pollution, rendements financiers journaliers, etc.

Dès les années 1970–80, des travaux fondateurs ont permis d'étendre certains résultats de convergence en introduisant des notions de dépendance asymptotique, suffisamment faibles pour garantir une forme de « quasi-indépendance » entre les événements extrêmes (voir Leadbetter (1974) et Leadbetter (1983)). Plus récemment, une approche plus flexible a émergé : celle des copules. Les copules permettent de modéliser séparément la dépendance entre variables et leur comportement marginal, en s'appuyant notamment sur le théorème de Sklar (1959). Cette méthode a profondément renouvelé la modélisation des extrêmes dépendants, en particulier dans un cadre multivarié. On renvoie à Nelsen (2006), Joe (2015), ou Durante et Sempi (2015).

La publication récente Herrmann, Hofert et Nešlehová (2024) présente un point de vue différent : elle établit les conditions de convergence du maximum dans un cadre général dépendant, basé sur les copules. Ce cadre théorique permet de généraliser le théorème de Fisher–Tippett–Gnedenko à des séquences de variables aléatoires dépendantes, en intégrant directement la structure de dépendance via une fonction limite.

Le projet de thèse vise à développer des techniques d'inférence fréquentiste et bayésienne pour estimer la loi limite du maximum sous des hypothèses de dépendance. Les méthodes bayésiennes sont particulièrement adaptées aux situations où l'information est rare ou incertaine - ce qui est typiquement le cas dans l'analyse des extrêmes, voir Beirlant et al. (2004, Chapitre 11) ou Bousquet & Bernardara (2021, Chapitre 11). En introduisant des distributions a priori souples sur les paramètres, on peut obtenir :
- des intervalles de crédibilité (plutôt que de simples intervalles de confiance),
- une prévision de densité pour les observations extrêmes,
- une meilleure prise en compte de la structure de dépendance, notamment dans des modèles échangeables, comme ceux évoqués dans Herrmann, Hofert \& Neslehova (2024).

La thèse visera ainsi à développer et à étudier des estimateurs ainsi qu'à évaluer leur performance sur des données simulées et réelles, par exemple météorologiques ou financières.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Univariate extreme value theory (EVT) states that the maximum of a sequence of independent, identically distributed random variables converges to a Generalized Extreme Value (GEV) distribution. However, the assumption of independence is often unrealistic in real-world applications, where data are typically temporally or spatially correlated - e.g., wave heights, temperature records, pollution levels, or financial returns.

Pioneering work by Leadbetter (1974, 1983) relaxed the independence assumption by introducing asymptotic dependence conditions, allowing a form of “quasi-independence” between extreme events. More recently, copula-based approaches have enabled the separate modeling of marginal behavior and dependence structure (Sklar, 1959), significantly advancing the field, especially in multivariate settings. We refer to Nelsen (2006), Joe (2015), or Durante and Sempi (2015) for textbook introductions.

A different point-of-view was proposed by Herrmann, Hofert, and Nešlehová (2024), who established convergence conditions for the maximum in a dependent univariate setting using copulas. This generalizes the Fisher-Tippett-Gnedenko theorem to sequences of dependent variables.

The aim of this thesis project is to develop frequentist and Bayesian inference techniques for estimating the limit distribution of the maximum under dependency assumptions. Bayesian methods are particularly suited to situations where information is scarce or uncertain - which is typically the case in the analysis of extremes, see Beirlant et al. (2004, Chapter 11) or Bousquet & Bernardara (2021, Chapter 11). By introducing flexible prior distributions on the parameters, we can obtain:
- credibility intervals (rather than simple confidence intervals),
- density prediction for extreme observations,
- better consideration of dependency structure, particularly in exchangeable models, such as those discussed in Herrmann, Hofert \& Nešlehová (2024).

The thesis will thus aim to develop and study estimators and evaluate their performance on simulated and real data, for example meteorological or financial data.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/10/2025

Funding category

Funding further details

Financement d'un établissement public Français

Presentation of host institution and host laboratory

Université de Montpellier

Institution awarding doctoral degree

Université de Montpellier

Graduate school

166 I2S - Information, Structures, Systèmes

Candidate's profile

Titulaire d'un M2 ou d'un diplôme d'ingénieur en statistique. Solides connaissances en mathématiques, notamment en statistiques et en théorie des probabilités, maîtrise de la programmation R et/ou Python.
M2 or engineering degree in statistics. Strong background in mathematics, particularly statistics and probability theory, proficiency in R and/or Python programming
2025-09-07
Partager via
Apply
Close

Vous avez déjà un compte ?

Nouvel utilisateur ?