Où docteurs et entreprises se rencontrent
Menu
Connexion

Approches statistiques pour l'étude et la prédiction la vulnérabilité génomique des populations et des espèces // PhD Position: Statistical approaches to investigate and predict genomic vulnerability of populations and species

ABG-133293
ADUM-67059
Sujet de Thèse
03/09/2025 Autre financement public
Université Paris-Saclay GS Mathématiques
Palaiseau cedex - Ile-de-France - France
Approches statistiques pour l'étude et la prédiction la vulnérabilité génomique des populations et des espèces // PhD Position: Statistical approaches to investigate and predict genomic vulnerability of populations and species
  • Mathématiques
Données de grande dimension, Inférence variationnelle, Machine Learning, Génétique des population
High dimensional data, Variational inference, Machine Learning, Population genetics

Description du sujet

L'objectif de cette thèse est de développer des approches statistiques pour l'analyse des études d'association Génome-Environnement (GEA) et de Décalage Génomique (Genomic Offset, GO) en s'appuyant sur les développements récents en optimisation et en inférence statistique. Plus précisément, le/la doctorant(e) recruté(e) développera des approches d'inférence variationnelle et d'optimisation stochastique pour la GEA afin d'accélérer l'inférence, afin de pouvoir analyser des jeux de données génomiques de grande taille modernes pouvant concerner des centaines de populations. Il/elle développera également des modèles probabilistes de GO inspirés de l'approche d'Analyse de Redondance et l'étendra en la combinant à des réseaux de neurones afin de traiter les relations non linéaires entre covariables et variables de réponse. À cette fin, le/la doctorant(e) rejoindra un consortium de chercheurs issus de différentes disciplines et bénéficiant d'une longue expérience en projets interdisciplinaires. La méthodologie développée sera appliquée à des jeux de données publics à des fins d'analyse comparative, ainsi qu'à un ensemble innovant de deux jeux de données correspondant à une plante domestique (le maïs) et à son ancêtre sauvage (la téosinte). La comparaison entre les deux espèces permettra d'étudier comment l'adaptation des espèces sauvages apparentées aux cultures aux environnements secs pourrait être informative sur la réponse du maïs à un climat plus extrême.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

The goal of the PhD project is to contribute to the development of innovative Genome-Environment Association (GEA) and Genomic Offset (GO) procedures that will build on recent advances in optimization and statistical inference. More specifically the recruited PhD student will consider variational inference approaches for GEA and stochastic optimization to speed up the inference, with the objective of scaling up to modern genomic datasets that may involve hundreds of populations. He/she will also develop probabilistic GO models inspired from the Redundancy Analysis approach and extend it by introducing Neural Networks in order to handle non-linear relationships between covariates and response variables. To this aim, the PhD student will join a consortium of researchers issued from different disciplines with a long experience in interdisciplinary projects. The developed methodology will be applied to public datasets for benchmarking purposes, as well as, to an innovative set of two datasets corresponding to a domestic plant (maize) and its wild “ancestor” (teosinte). This will enable us to investigate how adaptation of crop wild relatives to dry environments could be informative about the response of maize to a drier climate.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/10/2025
WEB : https://mia-ps.inrae.fr/sites/default/files/2025-05/PhD%20Position%20Genomic%20offset_offer.pdf

Nature du financement

Autre financement public

Précisions sur le financement

ANR*Autre type de financement

Présentation établissement et labo d'accueil

Université Paris-Saclay GS Mathématiques

Etablissement délivrant le doctorat

Université Paris-Saclay GS Mathématiques

Ecole doctorale

574 Mathématiques Hadamard

Profil du candidat

Etudiant(e) titulaire d'un Master II en Statistique / Machine Learning Compétences approfondies de programmation en R ou Python Une première expérience d'analyse de données génomiques ou en biostatistique est recommandée. Forte appétence pour le travail multidisciplinaire et en équipe.
The requirements are the following: - A Master'sdegree in Applied Mathematics / Statistics / Machine Learning, - Advanced programming skills in Python and/or R. - Prior experience in biostatistics and genomic data analysis is desirable but not essential. - A strong interest in applications in biology and ability to work in a multidisciplinary team
30/09/2025
Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?