Evaluation des performances des modèles de fondation pour la détection et la prévision en surveillance syndromique : vers une détection / prévision automatisée et à large-échelle des signaux sanitaires. // Evaluation of Foundation Models' Performance for
|
ABG-137992
ADUM-73583 |
Thesis topic | |
| 2026-04-09 |
Université Paris-Est Créteil
Saint-Maurice - Ile-de-France - France
Evaluation des performances des modèles de fondation pour la détection et la prévision en surveillance syndromique : vers une détection / prévision automatisée et à large-échelle des signaux sanitaires. // Evaluation of Foundation Models' Performance for
- Biology
Surveillance syndromique, Modèles de fondation, Séries temporelles, Détection d'anomalies, Prévision épidémiologique, Intelligence artificielle en santé publique
Syndromic surveillance, Foundation models, Time series, Anomaly detection, Epidemiological forecasting, Artificial intelligence in public health
Syndromic surveillance, Foundation models, Time series, Anomaly detection, Epidemiological forecasting, Artificial intelligence in public health
Topic description
L'analyse des séries temporelles joue un rôle central en épidémiologie, notamment pour la détection précoce et la prévision des signaux sanitaires. Malgré la diversité des méthodes existantes, leur déploiement opérationnel reste limité en raison de leurs performances hétérogènes en fonction des contextes, de la variabilité des données, de leur complexité technique et des contraintes humaines. Les récents progrès en IA, en particulier les modèles de fondation (comme BERT ou GPT-5), ouvrent de nouvelles perspectives. Leur déclinaison pour les données temporelles, les modèles de fondation pour les séries temporelles (TSFMs), repose sur des architectures pré-entraînées à grande échelle capables d'analyser des séries temporelles sans ajustement préalable sur les données cibles. Leur potentiel en santé publique reste toutefois très peu exploré, notamment dans les systèmes de surveillance syndromique.
Cette thèse explore l'utilisation des TSFMs afin de renforcer la détection précoce des signaux sanitaires et d'améliorer les capacités d'anticipation des systèmes de surveillance de Santé publique France. Les données utilisées seront à la fois simulées à l'aide de méthodologies avancées et proviendront du système SurSaUD (OSCOUR), qui centralise des flux massifs et hétérogènes de données temporelles en provenance des services d'urgences.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Time series analysis plays a central role in epidemiology, particularly for the early detection and forecasting of health signals. Despite the diversity of existing methods, their operational deployment remains limited due to heterogeneous performance across contexts, data variability, technical complexity, and human resource constraints. Recent advances in artificial intelligence, especially foundation models (such as BERT or GPT-5), offer new opportunities. Their adaptation for temporal data—time series foundation models (TSFMs)—relies on large-scale pre-trained architectures capable of analyzing time series without prior fine-tuning on target data. However, their potential in public health, particularly within syndromic surveillance systems, remains largely unexplored.
This thesis investigates the use of TSFMs to enhance the early detection of health signals and to improve the anticipatory capabilities of Santé publique France's surveillance systems. The data used will include both simulated datasets generated through advanced methodologies and real-world data from the SurSaUD system (OSCOUR), which centralizes massive and heterogeneous streams of time series data from emergency departments.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Cette thèse explore l'utilisation des TSFMs afin de renforcer la détection précoce des signaux sanitaires et d'améliorer les capacités d'anticipation des systèmes de surveillance de Santé publique France. Les données utilisées seront à la fois simulées à l'aide de méthodologies avancées et proviendront du système SurSaUD (OSCOUR), qui centralise des flux massifs et hétérogènes de données temporelles en provenance des services d'urgences.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Time series analysis plays a central role in epidemiology, particularly for the early detection and forecasting of health signals. Despite the diversity of existing methods, their operational deployment remains limited due to heterogeneous performance across contexts, data variability, technical complexity, and human resource constraints. Recent advances in artificial intelligence, especially foundation models (such as BERT or GPT-5), offer new opportunities. Their adaptation for temporal data—time series foundation models (TSFMs)—relies on large-scale pre-trained architectures capable of analyzing time series without prior fine-tuning on target data. However, their potential in public health, particularly within syndromic surveillance systems, remains largely unexplored.
This thesis investigates the use of TSFMs to enhance the early detection of health signals and to improve the anticipatory capabilities of Santé publique France's surveillance systems. The data used will include both simulated datasets generated through advanced methodologies and real-world data from the SurSaUD system (OSCOUR), which centralizes massive and heterogeneous streams of time series data from emergency departments.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Funding category
Funding further details
Financement d'un établissement public Français
Presentation of host institution and host laboratory
Université Paris-Est Créteil
Institution awarding doctoral degree
Université Paris-Est Créteil
Graduate school
570 Santé Publique
Candidate's profile
M2 ou diplôme d'ingénieur avec stage de recherche en science des données / statistique avec un intérêt prononcé pour le domaine d'application (santé publique).
Compétences en informatique, intelligence artificielle, science des données.
Niveau avancé en programmation Python et R.
Compétences non-techniques : rigueur, travail en équipe, bonnes capacités d'analyse, d'adaptation et d'organisation
Un bon niveau d'anglais et de français (écrit et oral) sont exigés.
The ideal candidate will hold a Master's degree (M2) or an engineering degree, with a research internship in data science or statistics, and a strong interest in the field of public health. Required skills include expertise in computer science, artificial intelligence, and data science, as well as proficiency in Python and R programming. Non-technical competencies include rigor, teamwork, strong analytical abilities, adaptability, and organizational skills. Proficiency in both English and French (written and oral) is required.
The ideal candidate will hold a Master's degree (M2) or an engineering degree, with a research internship in data science or statistics, and a strong interest in the field of public health. Required skills include expertise in computer science, artificial intelligence, and data science, as well as proficiency in Python and R programming. Non-technical competencies include rigor, teamwork, strong analytical abilities, adaptability, and organizational skills. Proficiency in both English and French (written and oral) is required.
2026-05-08
Apply
Close
Vous avez déjà un compte ?
Nouvel utilisateur ?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
TotalEnergies
ONERA - The French Aerospace Lab
Tecknowmetrix
Aérocentre, Pôle d'excellence régional
Ifremer
Nantes Université
Groupe AFNOR - Association française de normalisation
ANRT
Medicen Paris Region
SUEZ
Généthon
Nokia Bell Labs France
Laboratoire National de Métrologie et d'Essais - LNE
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
ADEME
Servier
Institut Sup'biotech de Paris

