Analyse topologique des structures tridimensionnelles de protéines et réseaux de neurones topologiques pour l’étude de traits d’histoire de vie des organismes
ABG-132191 | Thesis topic | |
2025-05-24 | Public funding alone (i.e. government, region, European, international organization research grant) |
- Mathematics
- Biology
- Biotechnology
Topic description
L’Institut Camille Jordan propose une thèse de doctorat à temps plein sur le thème « Analyse topologique des structures tridimensionnelles de protéines et réseaux de neurones topologiques pour l’étude des traits d’histoire de vie des organismes ».
Cette thèse s’inscrit dans le cadre du projet DeltaFold, qui vise à développer de nouveaux outils mathématiques, algorithmiques et logiciels combinant topologie, apprentissage automatique et biologie moléculaire, afin d’identifier les signatures structurales des protéines associées aux traits d’histoire de vie.
L'objectif de la thèse est de développer des méthodes à l’interface de la biotopologie moléculaire et de l’apprentissage automatique, afin d’identifier les déterminants moléculaires et structurels de la piézo-résistance.
La biotopologie moléculaire consiste à étudier les macromolécules biologiques, essentiellement les protéines, et leurs propriétés fonctionnelles à l’aide de techniques issues de l’analyse topologique des données (TDA) et de la géométrie spectrale.
La thèse vise à développer de nouvelles représentations multi-échelles de ces macromolécules et d’en déterminer les caractéristiques géométriques (marqueurs de courbure) et spectrales (marqueurs spectraux). Ces marqueurs, construits à partir de courbures discrètes (Forman-Ricci et Ollivier-Ricci), du Laplacien persistant et de facteurs structurels, génomiques et environnementaux, constituent des représentations vectorielles des macromolécules. Des métriques adaptées seront définies afin d’entraîner des modèles prédictifs sur ces représentations, en combinant apprentissage profond et régression statistique, pour mieux comprendre les mécanismes de la piézo-résistance.
La thèse portera également sur la modélisation de l’évolution de ces marqueurs, en prenant en compte les traits d’histoire de vie des organismes, par des méthodes combinant phylogénie moléculaire et reconstruction de séquences ancestrales. L’objectif est de retracer l’évolution conjointe des structures, des séquences protéiques et des marqueurs topologiques le long des arbres phylogénétiques afin de tester les modèles proposés.
Les méthodes développées dans le cadre de la thèse seront implémentées dans la bibliothèque DeltaFold, développée en Python par une équipe interdisciplinaire de l’ICJ et du LBBE. Cette bibliothèque constitue un environnement de développement pour la programmation de modèles prédictifs en biologie évolutive, fondés sur des vectorisations des structures tridimensionnelles de protéines, via l’homologie persistante.
Les modèles prédictifs piézométriques seront validés par comparaison avec des résultats expérimentaux produits au sein du laboratoire MAP. Ces validations s’appuieront sur deux modèles procaryotes : les Thermococcales (81 espèces, chacune correspondant à environ 2 000 protéines, soit un jeu de données d’environ 162 000 protéines) et les Alteromonadales (> 1 000 espèces, chacune correspondant à environ 6 000 protéines) pour lesquels il conviendra de sélectionner un sous-ensemble réaliste centré sur les genres présentant des organismes piézophiles, Shewanella et Colwellia.
Cette thèse combine ainsi modélisation mathématique, biologie évolutive et apprentissage automatique pour explorer les mécanismes de l’adaptation aux hautes pressions.
Les résultats attendus incluent :
- Le développement de modèles d’apprentissage pour prédire les traits d’histoire de vie à partir de la structure des protéines ;
- L’identification de signatures moléculaires associées à la piézo-résistance ;
- L’intégration des avancées théoriques et logicielles dans l’environnement DeltaFold.
Starting date
Funding category
Funding further details
Presentation of host institution and host laboratory
L’Institut Camille Jordan (ICJ – UMR 5208 - https://math.univ-lyon1.fr/icj/) regroupe environ 280 membres, dont environ 180 membres permanents, répartis sur 6 équipes qui couvrent un très large spectre des mathématiques (Algèbre, Géométrie, Logique; Combinatoire et théorie des nombres; Modélisation Mathématique, Calcul Scientifique; Équations aux dérivées partielles, analyse; Probabilités, Statistique, Physique Mathématique; Histoire des Mathématiques; ). L’ICJ porte deux réseaux thématiques du CNRS : Théorie de nombres et Optimisation. Les recherches de l’ICJ portent sur l’ensemble des champs mathématiques, en lien avec d’autres disciplines (biologie, physique, informatique et le monde socio-économique, et sont reconnues par de nombreux prix et distinctions (membres de l’IUF, membres de l’académie de sciences, prix Montucla, prix Jean-Jacques Moreau…) et soutenues par des financements publics et privés (ANR, ERC, CIFRE, …).
Le laboratoire Microbiologie Adaptation Pathogénie (MAP - UMR 5240 - https://map.insa-lyon.fr/fr) développe des recherches visant à étudier les mécanismes d’adaptation et de pathogénie des microorganismes (archées, amibes, bactéries, champignons et levures). Les équipes du MAP développent des approches pluri-disciplinaires (biochimie, génétique, biologie moléculaire, imagerie, biophysique) ainsi que des approches globales (génomique, transcriptomique, protéomique, métabolomique, et modélisation mathématique), pour générer les connaissances intégratives permettant de comprendre les mécanismes d’adaptation phénotypique chez tous ces microorganismes.
Le Laboratoire de Biométrie et Biologie évolutive (LBBE - UMR 5558 - https://lbbe-web.univ-lyon1.fr/fr) développe des approches de formalisation mathématique pour rendre compte de l’organisation des systèmes biologiques complexes. La recherche développée au LBBE s'articule autour de trois axes : la biométrie avec des développements méthodologiques en statistique, informatique et mathématique pour la modélisation du vivant; l’écologie et l’évolution abordées de l’échelle moléculaire et génomique à l’échelle des populations et communautés; et la santé, en développant la médecine de précision.
Website :
Candidate's profile
Nous recherchons un candidat (H/F), disposant d’un solide dossier académique et titulaire d’un Master en mathématiques ou en bioinformatique. Une excellente formation théorique est indispensable. Une expérience préalable en analyse topologique des données (TDA), statistiques ou sciences des données constituera un atout apprécié. Le candidat (H/F) sera intégré dans une équipe pluridisciplinaire. Le candidat (H/F) doit donc posséder d’excellentes compétences personnelles et être capable de travailler en équipe. Compétences et qualifications : - Master ou équivalent en mathématiques ou bioinformatique. - Bonne maîtrise de l’anglais écrit et oral. - Capacités organisationnelles et aptitude à s’investir dans un travail interdisciplinaire et collaboratif. - Une bonne culture scientifique.
Vous avez déjà un compte ?
Nouvel utilisateur ?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
CESI
Généthon
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Institut Sup'biotech de Paris
ONERA - The French Aerospace Lab
Nokia Bell Labs France
CASDEN
SUEZ
TotalEnergies
Ifremer
Groupe AFNOR - Association française de normalisation
MabDesign
Aérocentre, Pôle d'excellence régional
ADEME
Laboratoire National de Métrologie et d'Essais - LNE
MabDesign
Tecknowmetrix
ANRT
PhDOOC