Où docteurs et entreprises se rencontrent
Menu
Connexion

Evaluation des performances des modèles de fondation pour la détection et la prévision en surveillance syndromique : vers une détection / prévision automatisée et à large-échelle des signaux sanitaires. // Evaluation of Foundation Models' Performance for

ABG-137992
ADUM-73583
Sujet de Thèse
09/04/2026
Université Paris-Est Créteil
Saint-Maurice - Ile-de-France - France
Evaluation des performances des modèles de fondation pour la détection et la prévision en surveillance syndromique : vers une détection / prévision automatisée et à large-échelle des signaux sanitaires. // Evaluation of Foundation Models' Performance for
  • Biologie
Surveillance syndromique, Modèles de fondation, Séries temporelles, Détection d'anomalies, Prévision épidémiologique, Intelligence artificielle en santé publique
Syndromic surveillance, Foundation models, Time series, Anomaly detection, Epidemiological forecasting, Artificial intelligence in public health

Description du sujet

L'analyse des séries temporelles joue un rôle central en épidémiologie, notamment pour la détection précoce et la prévision des signaux sanitaires. Malgré la diversité des méthodes existantes, leur déploiement opérationnel reste limité en raison de leurs performances hétérogènes en fonction des contextes, de la variabilité des données, de leur complexité technique et des contraintes humaines. Les récents progrès en IA, en particulier les modèles de fondation (comme BERT ou GPT-5), ouvrent de nouvelles perspectives. Leur déclinaison pour les données temporelles, les modèles de fondation pour les séries temporelles (TSFMs), repose sur des architectures pré-entraînées à grande échelle capables d'analyser des séries temporelles sans ajustement préalable sur les données cibles. Leur potentiel en santé publique reste toutefois très peu exploré, notamment dans les systèmes de surveillance syndromique.
Cette thèse explore l'utilisation des TSFMs afin de renforcer la détection précoce des signaux sanitaires et d'améliorer les capacités d'anticipation des systèmes de surveillance de Santé publique France. Les données utilisées seront à la fois simulées à l'aide de méthodologies avancées et proviendront du système SurSaUD (OSCOUR), qui centralise des flux massifs et hétérogènes de données temporelles en provenance des services d'urgences.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Time series analysis plays a central role in epidemiology, particularly for the early detection and forecasting of health signals. Despite the diversity of existing methods, their operational deployment remains limited due to heterogeneous performance across contexts, data variability, technical complexity, and human resource constraints. Recent advances in artificial intelligence, especially foundation models (such as BERT or GPT-5), offer new opportunities. Their adaptation for temporal data—time series foundation models (TSFMs)—relies on large-scale pre-trained architectures capable of analyzing time series without prior fine-tuning on target data. However, their potential in public health, particularly within syndromic surveillance systems, remains largely unexplored.
This thesis investigates the use of TSFMs to enhance the early detection of health signals and to improve the anticipatory capabilities of Santé publique France's surveillance systems. The data used will include both simulated datasets generated through advanced methodologies and real-world data from the SurSaUD system (OSCOUR), which centralizes massive and heterogeneous streams of time series data from emergency departments.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/10/2026

Nature du financement

Précisions sur le financement

Financement d'un établissement public Français

Présentation établissement et labo d'accueil

Université Paris-Est Créteil

Etablissement délivrant le doctorat

Université Paris-Est Créteil

Ecole doctorale

570 Santé Publique

Profil du candidat

M2 ou diplôme d'ingénieur avec stage de recherche en science des données / statistique avec un intérêt prononcé pour le domaine d'application (santé publique). Compétences en informatique, intelligence artificielle, science des données. Niveau avancé en programmation Python et R. Compétences non-techniques : rigueur, travail en équipe, bonnes capacités d'analyse, d'adaptation et d'organisation Un bon niveau d'anglais et de français (écrit et oral) sont exigés.
The ideal candidate will hold a Master's degree (M2) or an engineering degree, with a research internship in data science or statistics, and a strong interest in the field of public health. Required skills include expertise in computer science, artificial intelligence, and data science, as well as proficiency in Python and R programming. Non-technical competencies include rigor, teamwork, strong analytical abilities, adaptability, and organizational skills. Proficiency in both English and French (written and oral) is required.
08/05/2026
Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?