Stratégies de parallélisation éco-efficiente pour le calcul haute performance en géosciences // Eco-efficient parallelization strategies for high-performance computing in the geosciences
|
ABG-137386
ADUM-73017 |
Thesis topic | |
| 2026-03-31 | Other public funding |
Université d'Orléans
ORLEANS - Centre Val de Loire - France
Stratégies de parallélisation éco-efficiente pour le calcul haute performance en géosciences // Eco-efficient parallelization strategies for high-performance computing in the geosciences
- Computer science
parallelisme, calcul haute performance, géosciences, eco-efficience
parallelism, high performance computing, geosciences, eco-efficiency
parallelism, high performance computing, geosciences, eco-efficiency
Topic description
Pour répondre aux besoins scientifiques, les simulations et traitements numériques en géosciences deviennent de plus en plus complexes et intensifs en calcul. Ainsi, contenir les temps de traitement est l'une des conditions de la capacité applicative de la recherche. L'autre condition est la maîtrise de la consommation énergétique.
Cette thèse a pour objet d'accélérer les calculs et de les rendre éco-efficients. Si réduire le temps d'exécution permet de diminuer directement l'empreinte énergétique de chaque simulation, il est parfois préférable de chercher le bon ratio performance/coût énergétique. Dans cette double perspective, il est important de tirer parti des architectures multi-nœuds hétérogènes, combinant CPU, GPU et unités vectorielles. L'objectif est de fournir une méthodologie générale qui sera applicable à une classe de traitements avec, au-delà de la simple portabilité, l'enjeu de définir des stratégies de parallélisation capables de maximiser l'efficacité de chaque ressource, tout en intégrant les contraintes de consommation énergétique.
Le projet de thèse vise à
1. Concevoir des stratégies de parallélisation multi-niveaux, adaptées à des architectures hétérogènes et distribuées, combinant CPU multi-cœurs, accélération GPU et vectorisation SIMD.
2. Optimiser l'ordonnancement et la répartition des tâches afin de réduire les coûts énergétiques et de maximiser l'efficacité globale. Cette optimisation prendra en compte les caractéristiques des calculs (granularité, dépendances, irrégularité) et s'appuiera sur un flux de travail permettant d'optimiser de manière transparente l'agencement des données et le placement mémoire, en limitant les transferts inutiles et les cycles d'horloge perdus.
3. Développer un framework modulaire et accessible, fondé sur un DSL, permettant aux géoscientifiques de décrire leurs chaînes de calcul sans expertise informatique avancée, et intégrant un processus de génération automatique d'un code parallèle performant et économe, adapté à l'architecture cible.
Le cadre applicatif de cette thèse concernera la modélisation géologique qui est aujourd'hui incontournable pour une représentation quantitative du sous-sol. Elle a de nombreuses applications tant dans l'exploitation et la protection des ressources du sous-sol (minéraux, eau, énergie ...) que dans son aménagement (travaux publics, stockage, jumeaux numériques ...). Elle permet en effet de poser les fondations géométriques qui vont contrôler la distribution spatiale des propriétés physiques sur lesquelles vont s'appuyer la simulation de tous les autres processus physiques.
En modélisation géologique, une classe de traitements est particulièrement coûteuses en temps de calcul. Il s'agit de l'évaluation sur les sommets d'un maillage de graphes de type Constructive Solid Geometry, dont chaque nœud est un foncteur implicite. Cette classe de traitements requiert des plateformes de calcul haute performance, en raison de la complexité des calculs et du coût variable de l'évaluation des foncteurs. Plusieurs stratégies de parallélisme peuvent être utilisées et combinées en particulier au niveau des tâches élémentaires et/ou sur l'optimisation de l'évaluation des foncteurs. Un framework de traitements permettant d'exploiter la structure de graphe (souvent arborescente) et les différentes stratégies de parallélisation qui peuvent être combinées permettraient d'adapter la parallélisation et la répartition des calculs aux ressources disponibles, tout en maîtrisant le compromis entre performance et consommation énergétique.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
To meet scientific needs, simulations and numerical processing in geosciences are becoming increasingly complex and computationally intensive. Controlling processing time is therefore one of the key conditions for the applicability of research. Another condition is the management of energy consumption.
The aim of this PhD is to accelerate computations while making them energy-efficient. While reducing execution time directly lowers the energy footprint of each simulation, it is sometimes preferable to seek the optimal performance-to-energy-cost ratio. From this dual perspective, it is important to leverage heterogeneous multi-node architectures combining CPUs, GPUs, and vector units. The objective is to provide a general methodology applicable to a class of processing tasks, going beyond simple portability to define parallelization strategies capable of maximizing the efficiency of each resource while integrating energy consumption constraints.
The PhD project aims to:
1. Design multi-level parallelization strategies adapted to heterogeneous and distributed architectures, combining multi-core CPUs, GPU acceleration, and SIMD vectorization.
2. Optimize task scheduling and distribution to reduce energy costs and maximize overall efficiency. This optimization will take into account the characteristics of computations (granularity, dependencies, irregularity) and will rely on a workflow enabling transparent optimization of data layout and memory placement, while minimizing unnecessary data transfers and wasted clock cycles.
3. Develop a modular and accessible framework, based on a DSL, enabling geoscientists to describe their computational pipelines without requiring advanced programming expertise, and integrating an automatic code generation process to produce efficient and energy-saving parallel code adapted to the target architecture.
The application context of this PhD concerns geological modeling, which is now essential for a quantitative representation of the subsurface. It has numerous applications in both the exploitation and protection of subsurface resources (minerals, water, energy, etc.) and in its development (civil engineering, storage, digital twins, etc.). It provides the geometric foundations that control the spatial distribution of physical properties on which the simulation of all other physical processes relies.
In geological modeling, one class of processing is particularly computationally expensive: the evaluation at mesh vertices of graph-based representations of the Constructive Solid Geometry type, where each node is an implicit function. This class of processing requires high-performance computing platforms due to the complexity of the calculations and the variable cost of evaluating the functions. Several parallelization strategies can be used and combined, particularly at the level of elementary tasks and/or in optimizing function evaluation. A processing framework capable of exploiting the graph structure (often tree-like) and the various combinable parallelization strategies would make it possible to adapt parallelization and workload distribution to available resources, while maintaining control over the trade-off between performance and energy consumption.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Cette thèse a pour objet d'accélérer les calculs et de les rendre éco-efficients. Si réduire le temps d'exécution permet de diminuer directement l'empreinte énergétique de chaque simulation, il est parfois préférable de chercher le bon ratio performance/coût énergétique. Dans cette double perspective, il est important de tirer parti des architectures multi-nœuds hétérogènes, combinant CPU, GPU et unités vectorielles. L'objectif est de fournir une méthodologie générale qui sera applicable à une classe de traitements avec, au-delà de la simple portabilité, l'enjeu de définir des stratégies de parallélisation capables de maximiser l'efficacité de chaque ressource, tout en intégrant les contraintes de consommation énergétique.
Le projet de thèse vise à
1. Concevoir des stratégies de parallélisation multi-niveaux, adaptées à des architectures hétérogènes et distribuées, combinant CPU multi-cœurs, accélération GPU et vectorisation SIMD.
2. Optimiser l'ordonnancement et la répartition des tâches afin de réduire les coûts énergétiques et de maximiser l'efficacité globale. Cette optimisation prendra en compte les caractéristiques des calculs (granularité, dépendances, irrégularité) et s'appuiera sur un flux de travail permettant d'optimiser de manière transparente l'agencement des données et le placement mémoire, en limitant les transferts inutiles et les cycles d'horloge perdus.
3. Développer un framework modulaire et accessible, fondé sur un DSL, permettant aux géoscientifiques de décrire leurs chaînes de calcul sans expertise informatique avancée, et intégrant un processus de génération automatique d'un code parallèle performant et économe, adapté à l'architecture cible.
Le cadre applicatif de cette thèse concernera la modélisation géologique qui est aujourd'hui incontournable pour une représentation quantitative du sous-sol. Elle a de nombreuses applications tant dans l'exploitation et la protection des ressources du sous-sol (minéraux, eau, énergie ...) que dans son aménagement (travaux publics, stockage, jumeaux numériques ...). Elle permet en effet de poser les fondations géométriques qui vont contrôler la distribution spatiale des propriétés physiques sur lesquelles vont s'appuyer la simulation de tous les autres processus physiques.
En modélisation géologique, une classe de traitements est particulièrement coûteuses en temps de calcul. Il s'agit de l'évaluation sur les sommets d'un maillage de graphes de type Constructive Solid Geometry, dont chaque nœud est un foncteur implicite. Cette classe de traitements requiert des plateformes de calcul haute performance, en raison de la complexité des calculs et du coût variable de l'évaluation des foncteurs. Plusieurs stratégies de parallélisme peuvent être utilisées et combinées en particulier au niveau des tâches élémentaires et/ou sur l'optimisation de l'évaluation des foncteurs. Un framework de traitements permettant d'exploiter la structure de graphe (souvent arborescente) et les différentes stratégies de parallélisation qui peuvent être combinées permettraient d'adapter la parallélisation et la répartition des calculs aux ressources disponibles, tout en maîtrisant le compromis entre performance et consommation énergétique.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
To meet scientific needs, simulations and numerical processing in geosciences are becoming increasingly complex and computationally intensive. Controlling processing time is therefore one of the key conditions for the applicability of research. Another condition is the management of energy consumption.
The aim of this PhD is to accelerate computations while making them energy-efficient. While reducing execution time directly lowers the energy footprint of each simulation, it is sometimes preferable to seek the optimal performance-to-energy-cost ratio. From this dual perspective, it is important to leverage heterogeneous multi-node architectures combining CPUs, GPUs, and vector units. The objective is to provide a general methodology applicable to a class of processing tasks, going beyond simple portability to define parallelization strategies capable of maximizing the efficiency of each resource while integrating energy consumption constraints.
The PhD project aims to:
1. Design multi-level parallelization strategies adapted to heterogeneous and distributed architectures, combining multi-core CPUs, GPU acceleration, and SIMD vectorization.
2. Optimize task scheduling and distribution to reduce energy costs and maximize overall efficiency. This optimization will take into account the characteristics of computations (granularity, dependencies, irregularity) and will rely on a workflow enabling transparent optimization of data layout and memory placement, while minimizing unnecessary data transfers and wasted clock cycles.
3. Develop a modular and accessible framework, based on a DSL, enabling geoscientists to describe their computational pipelines without requiring advanced programming expertise, and integrating an automatic code generation process to produce efficient and energy-saving parallel code adapted to the target architecture.
The application context of this PhD concerns geological modeling, which is now essential for a quantitative representation of the subsurface. It has numerous applications in both the exploitation and protection of subsurface resources (minerals, water, energy, etc.) and in its development (civil engineering, storage, digital twins, etc.). It provides the geometric foundations that control the spatial distribution of physical properties on which the simulation of all other physical processes relies.
In geological modeling, one class of processing is particularly computationally expensive: the evaluation at mesh vertices of graph-based representations of the Constructive Solid Geometry type, where each node is an implicit function. This class of processing requires high-performance computing platforms due to the complexity of the calculations and the variable cost of evaluating the functions. Several parallelization strategies can be used and combined, particularly at the level of elementary tasks and/or in optimizing function evaluation. A processing framework capable of exploiting the graph structure (often tree-like) and the various combinable parallelization strategies would make it possible to adapt parallelization and workload distribution to available resources, while maintaining control over the trade-off between performance and energy consumption.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Funding category
Other public funding
Funding further details
ANR Financement d'Agences de financement de la recherche
Presentation of host institution and host laboratory
Université d'Orléans
Institution awarding doctoral degree
Université d'Orléans
Graduate school
551 Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes - MIPTIS
Candidate's profile
Master en Informatique ayant une appétence pour le développement d'algorithmes et l'optimisation de code. Des compétences en géostatistique, géophysique et/ou modélisation 3D seraient un plus.
Master's degree in Computer Science with a strong interest in algorithm development and code optimization. Skills in geostatistics, geophysics, and/or 3D modeling would be a plus.
Master's degree in Computer Science with a strong interest in algorithm development and code optimization. Skills in geostatistics, geophysics, and/or 3D modeling would be a plus.
2026-05-17
Apply
Close
Vous avez déjà un compte ?
Nouvel utilisateur ?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
Groupe AFNOR - Association française de normalisation
Institut Sup'biotech de Paris
Tecknowmetrix
ADEME
Medicen Paris Region
Laboratoire National de Métrologie et d'Essais - LNE
SUEZ
Aérocentre, Pôle d'excellence régional
ANRT
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Généthon
Nokia Bell Labs France
TotalEnergies
ONERA - The French Aerospace Lab
Servier
Nantes Université
Ifremer
