Developpement d'une méthode de Drug design interactif: Chimie générative guidée par l'utilisateur // Human-in-the-loop Generative Chemistry: Interactive Monte-Carlo Tree Search and Real-Time 3D Visual Analytics for Structure-Based Ligand Design
|
ABG-138154
ADUM-72451 |
Sujet de Thèse | |
| 11/04/2026 | Contrat doctoral |
Sorbonne Université SIS (Sciences, Ingénierie, Santé)
Paris - Ile-de-France - France
Developpement d'une méthode de Drug design interactif: Chimie générative guidée par l'utilisateur // Human-in-the-loop Generative Chemistry: Interactive Monte-Carlo Tree Search and Real-Time 3D Visual Analytics for Structure-Based Ligand Design
- Informatique
Design Interactif, Chimie Générative, Drug Design, Interfaces homme machine, Experience utilisateur
Interactive Design, Generative Chemistry, Drug Design, CHI, User Experience
Interactive Design, Generative Chemistry, Drug Design, CHI, User Experience
Description du sujet
Les approches d'IA/ML de chimie générative permettent de concevoir des molécules de novo, mais restent souvent peu pilotables de manière interactive, calculs en batch, compromis difficiles à comprendre, et candidats parfois peu synthétisables. Cette thèse en informatique (IA + IHM) vise à transformer l'identification et le design de molecules a visée therapeutiques en une exploration interactive, explicable et reproductible, où l'algorithme de chimie générative explore systématiquement l'espace chimique et l'expert guide, biaise et contrôle les zones de l'espace chimique explorées. La boucle homme-machine s'appuie sur les principes « mixed-initiative » [1] et des recommandations de conception pour systèmes IA orientés utilisateur [2].
À partir d'un complexe récepteur–ligand (protéine ou ARN), nous extrairons un pharmacophore basé sur la structure décrivant les interactions moléculaires (liaisons H, hydrophobes, charges, aromatiques) et les volumes d'exclusion [3]. La génération est formulée comme une recherche dans un graphe/arbre de fragments moléculaires exploré par un Monte Carlo Tree Search (MCTS) multi-objectif : satisfaction des contraintes du pharmacophore, contraintes physico-chimiques, diversité/nouveauté et a priori de synthétisabilité [11]. Nous allons développer une variante de MCTS sous contraintes et sa robustesse aux biais définis interactivement (contraintes dures, re-pondération, verrouillage d'un motif).
Nous llons pour cela développer une interface 3D temps réel basée sur VTX développé dans l'équipe [7] : affichage du site de liaison, du pharmacophore, des candidats et interactions satisfaites/violées. Des contributions en informatique graphique sont attendues (rendu multi-candidats, gestion d'occlusions, focus+context, picking robuste, interactivité). Les candidats produits sont évalués par différentes méthodes : filtres rapides de synthétisabilité (RDKit/SA score [4]), scoring docking/champ de force, puis rescoring interprétable par champs d'interaction (MIF [5]) et NCI [6]. Des applications sur les interactions protéine - ARN seront envisagées avec nos collaborateurs experimentaux. Les ligands ARN, où certaines contraintes comme π-stacking et T-shape sont déterminantes [10] permettront d'évaluer la pertinence de la méthode développée .
Le projet est co-encadré par le Pr Matthieu Montes (CQSB UMR7238) et le Dr Antoine Taly (LBT UMR8266), s'appuyant sur UDock/UDock2 [8], VTX [7], SMIFER [9] et ClearSMILES (Reboul & Taly, JCIM) [10].
Références (sélection) : [1] Horvitz, CHI 1999. [2] Amershi et al., CHI 2019. [3] Wolber & Langer, JCIM 2005. [4] Ertl & Schuffenhauer, J Cheminf 2009. [5] Goodford, J Med Chem 1985. [6] Contreras-García et al., JCTC 2011. [7] Maria et al., Bioinformatics 2025 (VTX). [8] Levieux et al., Faraday Discuss 2014 ; Plateau-Holleville et al., Bioinformatics 2023. [9] Barquero Morera et al., JCTC 2025 (SMIFER). [10] Reboul et al., JCIM 2025 (ClearSMILES) ; Childs-Disney et al., Nat Rev Drug Discov 2022. [11] Gao et al., PNAS 2025 (SynFormer).
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Generative chemistry powered by AI/ML can allow to design molecules de novo and explore a vast chemical space. These workflows remain hard to control: batch outputs, unclear trade-offs, and candidates that are difficult to synthesize. This PhD proposal (Computer Science: AI + HCI) aims to turn structure-based ligand design into an interactive, explainable and reproducible exploration loop where a generative chemistry algorithm explores systematically chemical space interactively guided and constrained by the expert to preserve intent and agency. The human loop follows mixed-initiative principles [1] and established Human–AI interaction guidelines [2].
Starting from a receptor–ligand complex (protein or RNA), we will compute a structure-based pharmacophore encoding molecular interaction features (H-bond donors/acceptors, hydrophobics, charges, aromatic/stacking motifs), spatial tolerances, and excluded volumes [3]. Ligand generation is formulated as exploration of a graph/tree of partial molecules (fragments/reactions/conformations) searched by constrained, multi-objective Monte Carlo Tree Search (MCTS): pharmacophore satisfaction, physicochemical constraints, novelty/diversity, and synthesizability priors. Building on recent work that navigates explicitly synthesizable chemical space [11], we will study constrained MCTS variants and how to support online user edits—hard constraints, reweighting, or “locking” key interaction motifs.
We will develop a real-time 3D visual analytics interface built on VTX developed in the lab [7]. It displays the pocket, pharmacophore, streamed candidates and satisfied/violated interactions. Expected computer-graphics contributions include multi-candidate rendering, occlusion management, focus+context, robust picking, and interactive rendering. A staged quality-control cascade ensures realism: fast synthesizability filtering (RDKit/SA score [4]), docking/force-field scoring, then interpretability-oriented rescoring using Molecular Interaction Fields (MIF [5]) and NCI [6]. A strong application axis targets RNA binding sites, where π-stacking and T-shaped stacking are critical [10] and will be exposed as steerable constraints.
Co-supervision: Prof. Matthieu Montes (CQSB UMR7238) and Dr Antoine Taly (LBT UMR8266), leveraging UDock/UDock2 [8], VTX [7], SMIFER [9] and ClearSMILES (Reboul & Taly, JCIM) [10].
Selected references: [1] Horvitz, CHI 1999. [2] Amershi et al., CHI 2019. [3] Wolber & Langer, JCIM 2005. [4] Ertl & Schuffenhauer, J Cheminf 2009. [5] Goodford, J Med Chem 1985. [6] Contreras-García et al., JCTC 2011. [7] Maria et al., Bioinformatics 2025 (VTX). [8] Levieux et al., Faraday Discuss 2014 ; Plateau-Holleville et al., Bioinformatics 2023. [9] Barquero Morera et al., JCTC 2025 (SMIFER). [10] Reboul et al., JCIM 2025 (ClearSMILES) ; Childs-Disney et al., Nat Rev Drug Discov 2022. [11] Gao et al., PNAS 2025 (SynFormer).
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
À partir d'un complexe récepteur–ligand (protéine ou ARN), nous extrairons un pharmacophore basé sur la structure décrivant les interactions moléculaires (liaisons H, hydrophobes, charges, aromatiques) et les volumes d'exclusion [3]. La génération est formulée comme une recherche dans un graphe/arbre de fragments moléculaires exploré par un Monte Carlo Tree Search (MCTS) multi-objectif : satisfaction des contraintes du pharmacophore, contraintes physico-chimiques, diversité/nouveauté et a priori de synthétisabilité [11]. Nous allons développer une variante de MCTS sous contraintes et sa robustesse aux biais définis interactivement (contraintes dures, re-pondération, verrouillage d'un motif).
Nous llons pour cela développer une interface 3D temps réel basée sur VTX développé dans l'équipe [7] : affichage du site de liaison, du pharmacophore, des candidats et interactions satisfaites/violées. Des contributions en informatique graphique sont attendues (rendu multi-candidats, gestion d'occlusions, focus+context, picking robuste, interactivité). Les candidats produits sont évalués par différentes méthodes : filtres rapides de synthétisabilité (RDKit/SA score [4]), scoring docking/champ de force, puis rescoring interprétable par champs d'interaction (MIF [5]) et NCI [6]. Des applications sur les interactions protéine - ARN seront envisagées avec nos collaborateurs experimentaux. Les ligands ARN, où certaines contraintes comme π-stacking et T-shape sont déterminantes [10] permettront d'évaluer la pertinence de la méthode développée .
Le projet est co-encadré par le Pr Matthieu Montes (CQSB UMR7238) et le Dr Antoine Taly (LBT UMR8266), s'appuyant sur UDock/UDock2 [8], VTX [7], SMIFER [9] et ClearSMILES (Reboul & Taly, JCIM) [10].
Références (sélection) : [1] Horvitz, CHI 1999. [2] Amershi et al., CHI 2019. [3] Wolber & Langer, JCIM 2005. [4] Ertl & Schuffenhauer, J Cheminf 2009. [5] Goodford, J Med Chem 1985. [6] Contreras-García et al., JCTC 2011. [7] Maria et al., Bioinformatics 2025 (VTX). [8] Levieux et al., Faraday Discuss 2014 ; Plateau-Holleville et al., Bioinformatics 2023. [9] Barquero Morera et al., JCTC 2025 (SMIFER). [10] Reboul et al., JCIM 2025 (ClearSMILES) ; Childs-Disney et al., Nat Rev Drug Discov 2022. [11] Gao et al., PNAS 2025 (SynFormer).
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Generative chemistry powered by AI/ML can allow to design molecules de novo and explore a vast chemical space. These workflows remain hard to control: batch outputs, unclear trade-offs, and candidates that are difficult to synthesize. This PhD proposal (Computer Science: AI + HCI) aims to turn structure-based ligand design into an interactive, explainable and reproducible exploration loop where a generative chemistry algorithm explores systematically chemical space interactively guided and constrained by the expert to preserve intent and agency. The human loop follows mixed-initiative principles [1] and established Human–AI interaction guidelines [2].
Starting from a receptor–ligand complex (protein or RNA), we will compute a structure-based pharmacophore encoding molecular interaction features (H-bond donors/acceptors, hydrophobics, charges, aromatic/stacking motifs), spatial tolerances, and excluded volumes [3]. Ligand generation is formulated as exploration of a graph/tree of partial molecules (fragments/reactions/conformations) searched by constrained, multi-objective Monte Carlo Tree Search (MCTS): pharmacophore satisfaction, physicochemical constraints, novelty/diversity, and synthesizability priors. Building on recent work that navigates explicitly synthesizable chemical space [11], we will study constrained MCTS variants and how to support online user edits—hard constraints, reweighting, or “locking” key interaction motifs.
We will develop a real-time 3D visual analytics interface built on VTX developed in the lab [7]. It displays the pocket, pharmacophore, streamed candidates and satisfied/violated interactions. Expected computer-graphics contributions include multi-candidate rendering, occlusion management, focus+context, robust picking, and interactive rendering. A staged quality-control cascade ensures realism: fast synthesizability filtering (RDKit/SA score [4]), docking/force-field scoring, then interpretability-oriented rescoring using Molecular Interaction Fields (MIF [5]) and NCI [6]. A strong application axis targets RNA binding sites, where π-stacking and T-shaped stacking are critical [10] and will be exposed as steerable constraints.
Co-supervision: Prof. Matthieu Montes (CQSB UMR7238) and Dr Antoine Taly (LBT UMR8266), leveraging UDock/UDock2 [8], VTX [7], SMIFER [9] and ClearSMILES (Reboul & Taly, JCIM) [10].
Selected references: [1] Horvitz, CHI 1999. [2] Amershi et al., CHI 2019. [3] Wolber & Langer, JCIM 2005. [4] Ertl & Schuffenhauer, J Cheminf 2009. [5] Goodford, J Med Chem 1985. [6] Contreras-García et al., JCTC 2011. [7] Maria et al., Bioinformatics 2025 (VTX). [8] Levieux et al., Faraday Discuss 2014 ; Plateau-Holleville et al., Bioinformatics 2023. [9] Barquero Morera et al., JCTC 2025 (SMIFER). [10] Reboul et al., JCIM 2025 (ClearSMILES) ; Childs-Disney et al., Nat Rev Drug Discov 2022. [11] Gao et al., PNAS 2025 (SynFormer).
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Nature du financement
Contrat doctoral
Précisions sur le financement
Concours pour un contrat doctoral
Présentation établissement et labo d'accueil
Sorbonne Université SIS (Sciences, Ingénierie, Santé)
Etablissement délivrant le doctorat
Sorbonne Université SIS (Sciences, Ingénierie, Santé)
Ecole doctorale
130 Ecole Doctorale d'Informatique, Télécommunications et Electronique
Profil du candidat
Master ou ingénieur en informatique,
Bonne connaissance des bonnes pratiques en l'IHM, UX/UI
Maitrise du C++/Python
Une connaissance de CUDA, OpenGL, GLSL est un plus
Master or engineering degree in computer science Good knowledge in best practices for CHI, UX and UI Proficiency in C++/Python a good knowledge in CUDA, OpenGL and GLSL is a plus
Master or engineering degree in computer science Good knowledge in best practices for CHI, UX and UI Proficiency in C++/Python a good knowledge in CUDA, OpenGL and GLSL is a plus
01/05/2026
Postuler
Fermer
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
TotalEnergies
Laboratoire National de Métrologie et d'Essais - LNE
Aérocentre, Pôle d'excellence régional
Medicen Paris Region
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Institut Sup'biotech de Paris
Tecknowmetrix
Nokia Bell Labs France
ANRT
ADEME
Ifremer
Généthon
Groupe AFNOR - Association française de normalisation
SUEZ
Servier
ONERA - The French Aerospace Lab
Nantes Université
