Approches statistiques pour l'étude et la prédiction la vulnérabilité génomique des populations et des espèces // PhD Position: Statistical approaches to investigate and predict genomic vulnerability of populations and species
ABG-133293
ADUM-67059 |
Thesis topic | |
2025-09-03 | Other public funding |
Université Paris-Saclay GS Mathématiques
Palaiseau cedex - Ile-de-France - France
Approches statistiques pour l'étude et la prédiction la vulnérabilité génomique des populations et des espèces // PhD Position: Statistical approaches to investigate and predict genomic vulnerability of populations and species
- Mathematics
Données de grande dimension, Inférence variationnelle, Machine Learning, Génétique des population
High dimensional data, Variational inference, Machine Learning, Population genetics
High dimensional data, Variational inference, Machine Learning, Population genetics
Topic description
L'objectif de cette thèse est de développer des approches statistiques pour l'analyse des études d'association Génome-Environnement (GEA) et de Décalage Génomique (Genomic Offset, GO) en s'appuyant sur les développements récents en optimisation et en inférence statistique. Plus précisément, le/la doctorant(e) recruté(e) développera des approches d'inférence variationnelle et d'optimisation stochastique pour la GEA afin d'accélérer l'inférence, afin de pouvoir analyser des jeux de données génomiques de grande taille modernes pouvant concerner des centaines de populations. Il/elle développera également des modèles probabilistes de GO inspirés de l'approche d'Analyse de Redondance et l'étendra en la combinant à des réseaux de neurones afin de traiter les relations non linéaires entre covariables et variables de réponse. À cette fin, le/la doctorant(e) rejoindra un consortium de chercheurs issus de différentes disciplines et bénéficiant d'une longue expérience en projets interdisciplinaires. La méthodologie développée sera appliquée à des jeux de données publics à des fins d'analyse comparative, ainsi qu'à un ensemble innovant de deux jeux de données correspondant à une plante domestique (le maïs) et à son ancêtre sauvage (la téosinte). La comparaison entre les deux espèces permettra d'étudier comment l'adaptation des espèces sauvages apparentées aux cultures aux environnements secs pourrait être informative sur la réponse du maïs à un climat plus extrême.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
The goal of the PhD project is to contribute to the development of innovative Genome-Environment Association (GEA) and Genomic Offset (GO) procedures that will build on recent advances in optimization and statistical inference. More specifically the recruited PhD student will consider variational inference approaches for GEA and stochastic optimization to speed up the inference, with the objective of scaling up to modern genomic datasets that may involve hundreds of populations. He/she will also develop probabilistic GO models inspired from the Redundancy Analysis approach and extend it by introducing Neural Networks in order to handle non-linear relationships between covariates and response variables. To this aim, the PhD student will join a consortium of researchers issued from different disciplines with a long experience in interdisciplinary projects. The developed methodology will be applied to public datasets for benchmarking purposes, as well as, to an innovative set of two datasets corresponding to a domestic plant (maize) and its wild “ancestor” (teosinte). This will enable us to investigate how adaptation of crop wild relatives to dry environments could be informative about the response of maize to a drier climate.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
WEB : https://mia-ps.inrae.fr/sites/default/files/2025-05/PhD%20Position%20Genomic%20offset_offer.pdf
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
The goal of the PhD project is to contribute to the development of innovative Genome-Environment Association (GEA) and Genomic Offset (GO) procedures that will build on recent advances in optimization and statistical inference. More specifically the recruited PhD student will consider variational inference approaches for GEA and stochastic optimization to speed up the inference, with the objective of scaling up to modern genomic datasets that may involve hundreds of populations. He/she will also develop probabilistic GO models inspired from the Redundancy Analysis approach and extend it by introducing Neural Networks in order to handle non-linear relationships between covariates and response variables. To this aim, the PhD student will join a consortium of researchers issued from different disciplines with a long experience in interdisciplinary projects. The developed methodology will be applied to public datasets for benchmarking purposes, as well as, to an innovative set of two datasets corresponding to a domestic plant (maize) and its wild “ancestor” (teosinte). This will enable us to investigate how adaptation of crop wild relatives to dry environments could be informative about the response of maize to a drier climate.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
WEB : https://mia-ps.inrae.fr/sites/default/files/2025-05/PhD%20Position%20Genomic%20offset_offer.pdf
Funding category
Other public funding
Funding further details
ANR*Autre type de financement
Presentation of host institution and host laboratory
Université Paris-Saclay GS Mathématiques
Institution awarding doctoral degree
Université Paris-Saclay GS Mathématiques
Graduate school
574 Mathématiques Hadamard
Candidate's profile
Etudiant(e) titulaire d'un Master II en Statistique / Machine Learning
Compétences approfondies de programmation en R ou Python
Une première expérience d'analyse de données génomiques ou en biostatistique est recommandée.
Forte appétence pour le travail multidisciplinaire et en équipe.
The requirements are the following: - A Master'sdegree in Applied Mathematics / Statistics / Machine Learning, - Advanced programming skills in Python and/or R. - Prior experience in biostatistics and genomic data analysis is desirable but not essential. - A strong interest in applications in biology and ability to work in a multidisciplinary team
The requirements are the following: - A Master'sdegree in Applied Mathematics / Statistics / Machine Learning, - Advanced programming skills in Python and/or R. - Prior experience in biostatistics and genomic data analysis is desirable but not essential. - A strong interest in applications in biology and ability to work in a multidisciplinary team
2025-09-30
Apply
Close
Vous avez déjà un compte ?
Nouvel utilisateur ?
More information about ABG?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
Groupe AFNOR - Association française de normalisation
CASDEN
Nokia Bell Labs France
Généthon
TotalEnergies
ADEME
Ifremer
Tecknowmetrix
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Aérocentre, Pôle d'excellence régional
MabDesign
CESI
SUEZ
PhDOOC
MabDesign
ANRT
ONERA - The French Aerospace Lab
Laboratoire National de Métrologie et d'Essais - LNE
Institut Sup'biotech de Paris