Modélisation du pronostic du cancer du pancréas avec l'apprentissage profond et des données spatiales omiques // Multimodal Prognostic Modeling of Pancreatic Cancer Using Deep Learning and Spatial Omics
ABG-132291
ADUM-66349 |
Thesis topic | |
2025-05-29 |
Université de Bordeaux
Talence cedex - Nouvelle Aquitaine - France
Modélisation du pronostic du cancer du pancréas avec l'apprentissage profond et des données spatiales omiques // Multimodal Prognostic Modeling of Pancreatic Cancer Using Deep Learning and Spatial Omics
- Computer science
Cancer du pancréas, IA explicable, Pronostic, Apprentissage Profond, Donbnées Omiques spatiales, Fusion multimodale
Pancreatic cancer, XAI, Prognosis, Deep learning, Spatial omics, Multimodal fusion
Pancreatic cancer, XAI, Prognosis, Deep learning, Spatial omics, Multimodal fusion
Topic description
L'adénocarcinome canalaire pancréatique (PDAC) est l'un des cancers les plus agressifs et les plus mortels, avec un taux de survie à 5 ans inférieur à 10 % [JMF24]. Ce mauvais pronostic est dû à plusieurs facteurs, notamment un diagnostic tardif, une dissémination métastatique précoce et une efficacité thérapeutique limitée. Les stratégies actuelles de stratification clinique sont largement basées sur des critères anatomiques et histopathologiques, qui souvent ne rendent pas compte de l'hétérogénéité biologique sous-jacente des tumeurs. Il y a donc un besoin urgent de nouvelles méthodes pour mieux caractériser les tumeurs et prédire les résultats pour les patients.
Les récentes avancées technologiques en matière d'imagerie biomédicale et de profilage moléculaire - telles que l'imagerie par spectrométrie de masse MALDI (MSI) [TGB22], l'immunohistochimie (IHC), la coloration histologique (HS) et le séquençage de l'ADN à cellule unique (scDNASeq) - permettent l'exploration spatiale et multimodale des tissus tumoraux.
Pour relever ce défi, le groupe de recherche Biothérapies Génétiques et Oncologie (BioGO) de l'Institut d'Oncologie de Bordeaux (BRIC Inserm U1312), en collaboration avec le groupe de recherche MultiOMICS Multiscale Mass Spectrometry (M3 S) du CBMN, développe un workflow multi-omique spatial innovant qui combine l'imagerie par spectrométrie de masse à désorption/Ionisation laser assistée par matrice (MALDI-MSI), l'immunohistochimie (IHC) et d'autres techniques histologiques. Ce pipeline expérimental fournit un riche ensemble de données multimodales qui ouvrent de nouvelles voies pour comprendre l'hétérogénéité des tumeurs et prédire les résultats cliniques.
Parallèlement, les techniques d'apprentissage profond, en particulier les modèles basés sur les transformeurs, ont montré un grand potentiel dans le domaine de l'imagerie médicale. Ces modèles peuvent extraire des représentations de haut niveau à partir de données complexes et hétérogènes. Cependant, leur application à des données biomédicales multimodales et spatiales, en particulier en oncologie, reste un défi méthodologique en raison de la petite taille des échantillons typiques des cohortes cliniques et de la diversité des formats de données.
Ce projet de doctorat vise à développer des modèles d'apprentissage profond pour intégrer et analyser les données multimodales - en particulier MSI, IHC, HS, pour la stratification pronostique du cancer du pancréas. Le travail se concentrera sur la conception d'architectures à base de transformeurs pour la fusion de données d'imagerie, sur l'exploration de stratégies de fusion tardives et précoces, et sur l'évaluation comparative de ces modèles par rapport à des approches plus simples. Le but ultime est d'identifier des biomarqueurs multimodaux robustes qui peuvent être validés sur des ensembles de données publiques et des cohortes cliniques locales, et qui pourraient soutenir des stratégies de traitement plus personnalisées dans le cancer du pancréas.
Les principaux objectifs scientifiques sont :(1) concevoir et optimiser des architectures de réseaux de neurones convolutifs (CNN) pour une extraction efficace des caractéristiques des différentes modalités d'imagerie (MALDI-MSI, IHC, HS) ; (2) développer et mettre en œuvre des modèles de fusion utilisant des transformeurs de vision (ViTs) [LLC21] (3) étudier l'adaptation au domaine et l'apprentissage par transfert adaptés à des ensembles de données cliniques limités et hétérogènes [AKK18] ; et (4) évaluer rigoureusement et comparer les méthodes sur des cohortes cliniques locales (CHU de Bordeaux) et des bases de données d'imagerie moléculaire accessibles au public (telles que ProteomeCentral, IDR et ProteinAtlas).
La recherche doctorale sera soutenue par les compétences du LABRI en matière d'analyse de données visuelles et multimodales avec les réseaux de transformateurs et sur l'explication de leurs prédictions avec des méthodes d'IA explicables.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Pancreatic ductal adenocarcinoma (PDAC) is among the most aggressive and deadly cancers, with a 5-year survival rate below 10% [JMF24]. This poor prognosis is due to several factors, including late diagnosis, early metastatic dissemination, and limited treatment efficacy. Current clinical stratification strategies are largely based on anatomical and histopathological criteria, which often fail to capture the underlying biological heterogeneity of tumors. There is therefore an urgent need for new methods to better characterize tumors and predict patient outcomes.
Recent technological advances in biomedical imaging and molecular profiling—such as MALDI mass spectrometry imaging (MSI) [TGB22], immunohistochemistry (IHC), histological staining (HS), and single-cell DNA sequencing (scDNASeq)—allow for the spatial and multimodal exploration of tumor tissues.
To address this challenge, the research group Biotherapies Genetics and Oncology (BioGO) of the Bordeaux Institute of Oncology (BRIC Inserm U1312), in close collaboration with the research group MultiOMICS Multiscale Mass Spectrometry (M3 S) of CBMN, is developing an innovative spatial multi-omics workflow that combines Matrix-Assisted Laser Desorption/Ionization Mass Spectrometry Imaging (MALDI-MSI), immunohistochemistry (IHC), and other histological techniques. This experimental pipeline provides a rich set of spatially resolved and multimodal data that opens new avenues for understanding tumor heterogeneity and predicting clinical outcomes.
At the same time, deep learning techniques, particularly transformer-based models, have shown great potential in the medical imaging field. These models can extract high-level representations from complex and heterogeneous data. However, their application to multimodal and spatial biomedical data, especially in oncology, remains a methodological and computational challenge—particularly due to the small sample sizes typical of clinical cohorts and the diversity of data formats.
This PhD project aims to develop deep learning models to integrate and analyze multimodal data—specifically MSI, IHC, HS, and scDNASeq—for the prognostic stratification of pancreatic cancer. The work will focus on designing transformer-based architectures adapted to the fusion of spatial omics and imaging data, exploring late and early fusion strategies, and benchmarking these models against simpler approaches. The ultimate goal is to identify robust, multimodal biomarkers that can be validated on public datasets and local clinical cohorts, and that could support more personalized treatment strategies in pancreatic cancer.
The core scientific objectives are: (1) to design and optimize convolutional neural network (CNN) architectures, for effective feature extraction from individual imaging modalities (MALDI-MSI, IHC, HS); (2) to develop and implement fusion models leveraging Vision Transformers (ViTs) [LLC21] (3) to investigate domain adaptation and transfer learning tailored to limited and heterogeneous clinical datasets to improve model generalizability [AKK18]; and (4) to rigorously evaluate and benchmark these AI frameworks on both local clinical cohorts (including CHU Bordeaux) and publicly available molecular imaging databases (such as ProteomeCentral, IDR, and ProteinAtlas). The PhD research will be endorsed by the competences of LABRI invisual and multimodal data mining with the transformer networks and on the explanation of their predictions with explainable AI Methods.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 15/09/2025
Les récentes avancées technologiques en matière d'imagerie biomédicale et de profilage moléculaire - telles que l'imagerie par spectrométrie de masse MALDI (MSI) [TGB22], l'immunohistochimie (IHC), la coloration histologique (HS) et le séquençage de l'ADN à cellule unique (scDNASeq) - permettent l'exploration spatiale et multimodale des tissus tumoraux.
Pour relever ce défi, le groupe de recherche Biothérapies Génétiques et Oncologie (BioGO) de l'Institut d'Oncologie de Bordeaux (BRIC Inserm U1312), en collaboration avec le groupe de recherche MultiOMICS Multiscale Mass Spectrometry (M3 S) du CBMN, développe un workflow multi-omique spatial innovant qui combine l'imagerie par spectrométrie de masse à désorption/Ionisation laser assistée par matrice (MALDI-MSI), l'immunohistochimie (IHC) et d'autres techniques histologiques. Ce pipeline expérimental fournit un riche ensemble de données multimodales qui ouvrent de nouvelles voies pour comprendre l'hétérogénéité des tumeurs et prédire les résultats cliniques.
Parallèlement, les techniques d'apprentissage profond, en particulier les modèles basés sur les transformeurs, ont montré un grand potentiel dans le domaine de l'imagerie médicale. Ces modèles peuvent extraire des représentations de haut niveau à partir de données complexes et hétérogènes. Cependant, leur application à des données biomédicales multimodales et spatiales, en particulier en oncologie, reste un défi méthodologique en raison de la petite taille des échantillons typiques des cohortes cliniques et de la diversité des formats de données.
Ce projet de doctorat vise à développer des modèles d'apprentissage profond pour intégrer et analyser les données multimodales - en particulier MSI, IHC, HS, pour la stratification pronostique du cancer du pancréas. Le travail se concentrera sur la conception d'architectures à base de transformeurs pour la fusion de données d'imagerie, sur l'exploration de stratégies de fusion tardives et précoces, et sur l'évaluation comparative de ces modèles par rapport à des approches plus simples. Le but ultime est d'identifier des biomarqueurs multimodaux robustes qui peuvent être validés sur des ensembles de données publiques et des cohortes cliniques locales, et qui pourraient soutenir des stratégies de traitement plus personnalisées dans le cancer du pancréas.
Les principaux objectifs scientifiques sont :(1) concevoir et optimiser des architectures de réseaux de neurones convolutifs (CNN) pour une extraction efficace des caractéristiques des différentes modalités d'imagerie (MALDI-MSI, IHC, HS) ; (2) développer et mettre en œuvre des modèles de fusion utilisant des transformeurs de vision (ViTs) [LLC21] (3) étudier l'adaptation au domaine et l'apprentissage par transfert adaptés à des ensembles de données cliniques limités et hétérogènes [AKK18] ; et (4) évaluer rigoureusement et comparer les méthodes sur des cohortes cliniques locales (CHU de Bordeaux) et des bases de données d'imagerie moléculaire accessibles au public (telles que ProteomeCentral, IDR et ProteinAtlas).
La recherche doctorale sera soutenue par les compétences du LABRI en matière d'analyse de données visuelles et multimodales avec les réseaux de transformateurs et sur l'explication de leurs prédictions avec des méthodes d'IA explicables.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Pancreatic ductal adenocarcinoma (PDAC) is among the most aggressive and deadly cancers, with a 5-year survival rate below 10% [JMF24]. This poor prognosis is due to several factors, including late diagnosis, early metastatic dissemination, and limited treatment efficacy. Current clinical stratification strategies are largely based on anatomical and histopathological criteria, which often fail to capture the underlying biological heterogeneity of tumors. There is therefore an urgent need for new methods to better characterize tumors and predict patient outcomes.
Recent technological advances in biomedical imaging and molecular profiling—such as MALDI mass spectrometry imaging (MSI) [TGB22], immunohistochemistry (IHC), histological staining (HS), and single-cell DNA sequencing (scDNASeq)—allow for the spatial and multimodal exploration of tumor tissues.
To address this challenge, the research group Biotherapies Genetics and Oncology (BioGO) of the Bordeaux Institute of Oncology (BRIC Inserm U1312), in close collaboration with the research group MultiOMICS Multiscale Mass Spectrometry (M3 S) of CBMN, is developing an innovative spatial multi-omics workflow that combines Matrix-Assisted Laser Desorption/Ionization Mass Spectrometry Imaging (MALDI-MSI), immunohistochemistry (IHC), and other histological techniques. This experimental pipeline provides a rich set of spatially resolved and multimodal data that opens new avenues for understanding tumor heterogeneity and predicting clinical outcomes.
At the same time, deep learning techniques, particularly transformer-based models, have shown great potential in the medical imaging field. These models can extract high-level representations from complex and heterogeneous data. However, their application to multimodal and spatial biomedical data, especially in oncology, remains a methodological and computational challenge—particularly due to the small sample sizes typical of clinical cohorts and the diversity of data formats.
This PhD project aims to develop deep learning models to integrate and analyze multimodal data—specifically MSI, IHC, HS, and scDNASeq—for the prognostic stratification of pancreatic cancer. The work will focus on designing transformer-based architectures adapted to the fusion of spatial omics and imaging data, exploring late and early fusion strategies, and benchmarking these models against simpler approaches. The ultimate goal is to identify robust, multimodal biomarkers that can be validated on public datasets and local clinical cohorts, and that could support more personalized treatment strategies in pancreatic cancer.
The core scientific objectives are: (1) to design and optimize convolutional neural network (CNN) architectures, for effective feature extraction from individual imaging modalities (MALDI-MSI, IHC, HS); (2) to develop and implement fusion models leveraging Vision Transformers (ViTs) [LLC21] (3) to investigate domain adaptation and transfer learning tailored to limited and heterogeneous clinical datasets to improve model generalizability [AKK18]; and (4) to rigorously evaluate and benchmark these AI frameworks on both local clinical cohorts (including CHU Bordeaux) and publicly available molecular imaging databases (such as ProteomeCentral, IDR, and ProteinAtlas). The PhD research will be endorsed by the competences of LABRI invisual and multimodal data mining with the transformer networks and on the explanation of their predictions with explainable AI Methods.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 15/09/2025
Funding category
Funding further details
Financement d'un établissement public Français
Presentation of host institution and host laboratory
Université de Bordeaux
Institution awarding doctoral degree
Université de Bordeaux
Graduate school
39 Mathématiques et Informatique
Candidate's profile
Avec les compétences en acquisition et analyse d'images, apprentissage profond, programmation en Python, modélisation mathématique, conception du logiciel Anglais
Skills in image acquisition and processing, Deep Learning, Python programming, mathematical modeling, SW design.
Skills in image acquisition and processing, Deep Learning, Python programming, mathematical modeling, SW design.
2025-07-01
Apply
Close
Vous avez déjà un compte ?
Nouvel utilisateur ?
More information about ABG?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
ANRT
Aérocentre, Pôle d'excellence régional
MabDesign
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
CESI
MabDesign
Institut Sup'biotech de Paris
Généthon
Nokia Bell Labs France
TotalEnergies
Laboratoire National de Métrologie et d'Essais - LNE
CASDEN
SUEZ
ADEME
Tecknowmetrix
ONERA - The French Aerospace Lab
Ifremer
PhDOOC
Groupe AFNOR - Association française de normalisation