Where PhDs and companies meet
Menu
Login

Analyse topologique des structures tridimensionnelles de protéines et réseaux de neurones topologiques pour l’étude de traits d’histoire de vie des organismes

ABG-132191 Thesis topic
2025-05-24 Public funding alone (i.e. government, region, European, international organization research grant)
Université Claude Bernard Lyon 1
- Auvergne-Rhône-Alpes - France
Analyse topologique des structures tridimensionnelles de protéines et réseaux de neurones topologiques pour l’étude de traits d’histoire de vie des organismes
  • Mathematics
  • Biology
  • Biotechnology
Evolution, Protéine, traits d'histoire de vie, homologie persistente, géométrie spectrale

Topic description

L’Institut Camille Jordan propose une thèse de doctorat à temps plein sur le thème « Analyse topologique des structures tridimensionnelles de protéines et réseaux de neurones topologiques pour l’étude des traits d’histoire de vie des organismes ».

Cette thèse s’inscrit dans le cadre du projet DeltaFold, qui vise à développer de nouveaux outils mathématiques, algorithmiques et logiciels combinant topologie, apprentissage automatique et biologie moléculaire, afin d’identifier les signatures structurales des protéines associées aux traits d’histoire de vie.

L'objectif de la thèse est de développer des méthodes à l’interface de la biotopologie moléculaire et de l’apprentissage automatique, afin d’identifier les déterminants moléculaires et structurels de la piézo-résistance.

La biotopologie moléculaire consiste à étudier les macromolécules biologiques, essentiellement les protéines, et leurs propriétés fonctionnelles à l’aide de techniques issues de l’analyse topologique des données (TDA) et de la géométrie spectrale.

La thèse vise à développer de nouvelles représentations multi-échelles de ces macromolécules et d’en déterminer les caractéristiques géométriques (marqueurs de courbure) et spectrales (marqueurs spectraux). Ces marqueurs, construits à partir de courbures discrètes (Forman-Ricci et Ollivier-Ricci), du Laplacien persistant et de facteurs structurels, génomiques et environnementaux, constituent des représentations vectorielles des macromolécules. Des métriques adaptées seront définies afin d’entraîner des modèles prédictifs sur ces représentations, en combinant apprentissage profond et régression statistique, pour mieux comprendre les mécanismes de la piézo-résistance.

La thèse portera également sur la modélisation de l’évolution de ces marqueurs, en prenant en compte les traits d’histoire de vie des organismes, par des méthodes combinant phylogénie moléculaire et reconstruction de séquences ancestrales. L’objectif est de retracer l’évolution conjointe des structures, des séquences protéiques et des marqueurs topologiques le long des arbres phylogénétiques afin de tester les modèles proposés.

Les méthodes développées dans le cadre de la thèse seront implémentées dans la bibliothèque DeltaFold, développée en Python par une équipe interdisciplinaire de l’ICJ et du LBBE. Cette bibliothèque constitue un environnement de développement pour la programmation de modèles prédictifs en biologie évolutive, fondés sur des vectorisations des structures tridimensionnelles de protéines, via l’homologie persistante.

Les modèles prédictifs piézométriques seront validés par comparaison avec des résultats expérimentaux produits au sein du laboratoire MAP. Ces validations s’appuieront sur deux modèles procaryotes : les Thermococcales (81 espèces, chacune correspondant à environ 2 000 protéines, soit un jeu de données d’environ 162 000 protéines) et les Alteromonadales (> 1 000 espèces, chacune correspondant à environ 6 000 protéines) pour lesquels il conviendra de sélectionner un sous-ensemble réaliste centré sur les genres présentant des organismes piézophiles, Shewanella et Colwellia.

Cette thèse combine ainsi modélisation mathématique, biologie évolutive et apprentissage automatique pour explorer les mécanismes de l’adaptation aux hautes pressions.

Les résultats attendus incluent :

  • Le développement de modèles d’apprentissage pour prédire les traits d’histoire de vie à partir de la structure des protéines ;
  • L’identification de signatures moléculaires associées à la piézo-résistance ;
  • L’intégration des avancées théoriques et logicielles dans l’environnement DeltaFold.

Starting date

2025-10-01

Funding category

Public funding alone (i.e. government, region, European, international organization research grant)

Funding further details

Bourse MITI du CNRS

Presentation of host institution and host laboratory

Université Claude Bernard Lyon 1

L’Institut Camille Jordan (ICJ – UMR 5208 - https://math.univ-lyon1.fr/icj/) regroupe environ 280 membres, dont environ 180 membres permanents, répartis  sur 6 équipes qui couvrent un très large spectre des mathématiques (Algèbre, Géométrie, Logique; Combinatoire et théorie des nombres; Modélisation Mathématique, Calcul Scientifique; Équations aux dérivées partielles, analyse; Probabilités, Statistique, Physique Mathématique; Histoire des Mathématiques; ). L’ICJ porte deux réseaux thématiques du CNRS : Théorie de nombres et Optimisation. Les recherches de l’ICJ portent sur l’ensemble des champs mathématiques, en lien avec d’autres disciplines (biologie, physique, informatique et le monde socio-économique, et sont reconnues par de nombreux prix et distinctions (membres de l’IUF, membres de l’académie de sciences, prix Montucla, prix Jean-Jacques Moreau…) et soutenues par des financements publics et privés (ANR, ERC, CIFRE, …).

Le laboratoire Microbiologie Adaptation Pathogénie (MAP - UMR 5240 - https://map.insa-lyon.fr/fr) développe des recherches visant à étudier les mécanismes d’adaptation et de pathogénie des microorganismes (archées, amibes, bactéries, champignons et levures). Les équipes du MAP développent des approches pluri-disciplinaires (biochimie, génétique, biologie moléculaire, imagerie, biophysique) ainsi que des approches globales (génomique, transcriptomique, protéomique, métabolomique, et modélisation mathématique), pour générer les connaissances intégratives permettant de comprendre les mécanismes d’adaptation phénotypique chez tous ces microorganismes.

Le Laboratoire de Biométrie et Biologie évolutive (LBBE - UMR 5558 - https://lbbe-web.univ-lyon1.fr/fr) développe des approches de formalisation mathématique pour rendre compte de l’organisation des systèmes biologiques complexes. La recherche développée au LBBE s'articule autour de trois axes : la biométrie avec des développements méthodologiques en statistique, informatique et mathématique pour la modélisation du vivant; l’écologie et l’évolution abordées de l’échelle moléculaire et génomique à l’échelle des populations et communautés; et la santé, en développant la médecine de précision.

Candidate's profile

Nous recherchons un candidat (H/F), disposant d’un solide dossier académique et titulaire d’un Master en mathématiques ou en bioinformatique. Une excellente formation théorique est indispensable. Une expérience préalable en analyse topologique des données (TDA), statistiques ou sciences des données constituera un atout apprécié. Le candidat (H/F) sera intégré dans une équipe pluridisciplinaire. Le candidat (H/F) doit donc posséder d’excellentes compétences personnelles et être capable de travailler en équipe. Compétences et qualifications : - Master ou équivalent en mathématiques ou bioinformatique. - Bonne maîtrise de l’anglais écrit et oral. - Capacités organisationnelles et aptitude à s’investir dans un travail interdisciplinaire et collaboratif. - Une bonne culture scientifique.

Partager via
Apply
Close

Vous avez déjà un compte ?

Nouvel utilisateur ?