Stratégies de parallélisation éco-efficiente pour le calcul haute performance en géosciences // Eco-efficient parallelization strategies for high-performance computing in the geosciences
|
ABG-137386
ADUM-73017 |
Sujet de Thèse | |
| 31/03/2026 | Autre financement public |
Université d'Orléans
ORLEANS - Centre Val de Loire - France
Stratégies de parallélisation éco-efficiente pour le calcul haute performance en géosciences // Eco-efficient parallelization strategies for high-performance computing in the geosciences
- Informatique
parallelisme, calcul haute performance, géosciences, eco-efficience
parallelism, high performance computing, geosciences, eco-efficiency
parallelism, high performance computing, geosciences, eco-efficiency
Description du sujet
Pour répondre aux besoins scientifiques, les simulations et traitements numériques en géosciences deviennent de plus en plus complexes et intensifs en calcul. Ainsi, contenir les temps de traitement est l'une des conditions de la capacité applicative de la recherche. L'autre condition est la maîtrise de la consommation énergétique.
Cette thèse a pour objet d'accélérer les calculs et de les rendre éco-efficients. Si réduire le temps d'exécution permet de diminuer directement l'empreinte énergétique de chaque simulation, il est parfois préférable de chercher le bon ratio performance/coût énergétique. Dans cette double perspective, il est important de tirer parti des architectures multi-nœuds hétérogènes, combinant CPU, GPU et unités vectorielles. L'objectif est de fournir une méthodologie générale qui sera applicable à une classe de traitements avec, au-delà de la simple portabilité, l'enjeu de définir des stratégies de parallélisation capables de maximiser l'efficacité de chaque ressource, tout en intégrant les contraintes de consommation énergétique.
Le projet de thèse vise à
1. Concevoir des stratégies de parallélisation multi-niveaux, adaptées à des architectures hétérogènes et distribuées, combinant CPU multi-cœurs, accélération GPU et vectorisation SIMD.
2. Optimiser l'ordonnancement et la répartition des tâches afin de réduire les coûts énergétiques et de maximiser l'efficacité globale. Cette optimisation prendra en compte les caractéristiques des calculs (granularité, dépendances, irrégularité) et s'appuiera sur un flux de travail permettant d'optimiser de manière transparente l'agencement des données et le placement mémoire, en limitant les transferts inutiles et les cycles d'horloge perdus.
3. Développer un framework modulaire et accessible, fondé sur un DSL, permettant aux géoscientifiques de décrire leurs chaînes de calcul sans expertise informatique avancée, et intégrant un processus de génération automatique d'un code parallèle performant et économe, adapté à l'architecture cible.
Le cadre applicatif de cette thèse concernera la modélisation géologique qui est aujourd'hui incontournable pour une représentation quantitative du sous-sol. Elle a de nombreuses applications tant dans l'exploitation et la protection des ressources du sous-sol (minéraux, eau, énergie ...) que dans son aménagement (travaux publics, stockage, jumeaux numériques ...). Elle permet en effet de poser les fondations géométriques qui vont contrôler la distribution spatiale des propriétés physiques sur lesquelles vont s'appuyer la simulation de tous les autres processus physiques.
En modélisation géologique, une classe de traitements est particulièrement coûteuses en temps de calcul. Il s'agit de l'évaluation sur les sommets d'un maillage de graphes de type Constructive Solid Geometry, dont chaque nœud est un foncteur implicite. Cette classe de traitements requiert des plateformes de calcul haute performance, en raison de la complexité des calculs et du coût variable de l'évaluation des foncteurs. Plusieurs stratégies de parallélisme peuvent être utilisées et combinées en particulier au niveau des tâches élémentaires et/ou sur l'optimisation de l'évaluation des foncteurs. Un framework de traitements permettant d'exploiter la structure de graphe (souvent arborescente) et les différentes stratégies de parallélisation qui peuvent être combinées permettraient d'adapter la parallélisation et la répartition des calculs aux ressources disponibles, tout en maîtrisant le compromis entre performance et consommation énergétique.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
To meet scientific needs, simulations and numerical processing in geosciences are becoming increasingly complex and computationally intensive. Controlling processing time is therefore one of the key conditions for the applicability of research. Another condition is the management of energy consumption.
The aim of this PhD is to accelerate computations while making them energy-efficient. While reducing execution time directly lowers the energy footprint of each simulation, it is sometimes preferable to seek the optimal performance-to-energy-cost ratio. From this dual perspective, it is important to leverage heterogeneous multi-node architectures combining CPUs, GPUs, and vector units. The objective is to provide a general methodology applicable to a class of processing tasks, going beyond simple portability to define parallelization strategies capable of maximizing the efficiency of each resource while integrating energy consumption constraints.
The PhD project aims to:
1. Design multi-level parallelization strategies adapted to heterogeneous and distributed architectures, combining multi-core CPUs, GPU acceleration, and SIMD vectorization.
2. Optimize task scheduling and distribution to reduce energy costs and maximize overall efficiency. This optimization will take into account the characteristics of computations (granularity, dependencies, irregularity) and will rely on a workflow enabling transparent optimization of data layout and memory placement, while minimizing unnecessary data transfers and wasted clock cycles.
3. Develop a modular and accessible framework, based on a DSL, enabling geoscientists to describe their computational pipelines without requiring advanced programming expertise, and integrating an automatic code generation process to produce efficient and energy-saving parallel code adapted to the target architecture.
The application context of this PhD concerns geological modeling, which is now essential for a quantitative representation of the subsurface. It has numerous applications in both the exploitation and protection of subsurface resources (minerals, water, energy, etc.) and in its development (civil engineering, storage, digital twins, etc.). It provides the geometric foundations that control the spatial distribution of physical properties on which the simulation of all other physical processes relies.
In geological modeling, one class of processing is particularly computationally expensive: the evaluation at mesh vertices of graph-based representations of the Constructive Solid Geometry type, where each node is an implicit function. This class of processing requires high-performance computing platforms due to the complexity of the calculations and the variable cost of evaluating the functions. Several parallelization strategies can be used and combined, particularly at the level of elementary tasks and/or in optimizing function evaluation. A processing framework capable of exploiting the graph structure (often tree-like) and the various combinable parallelization strategies would make it possible to adapt parallelization and workload distribution to available resources, while maintaining control over the trade-off between performance and energy consumption.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Cette thèse a pour objet d'accélérer les calculs et de les rendre éco-efficients. Si réduire le temps d'exécution permet de diminuer directement l'empreinte énergétique de chaque simulation, il est parfois préférable de chercher le bon ratio performance/coût énergétique. Dans cette double perspective, il est important de tirer parti des architectures multi-nœuds hétérogènes, combinant CPU, GPU et unités vectorielles. L'objectif est de fournir une méthodologie générale qui sera applicable à une classe de traitements avec, au-delà de la simple portabilité, l'enjeu de définir des stratégies de parallélisation capables de maximiser l'efficacité de chaque ressource, tout en intégrant les contraintes de consommation énergétique.
Le projet de thèse vise à
1. Concevoir des stratégies de parallélisation multi-niveaux, adaptées à des architectures hétérogènes et distribuées, combinant CPU multi-cœurs, accélération GPU et vectorisation SIMD.
2. Optimiser l'ordonnancement et la répartition des tâches afin de réduire les coûts énergétiques et de maximiser l'efficacité globale. Cette optimisation prendra en compte les caractéristiques des calculs (granularité, dépendances, irrégularité) et s'appuiera sur un flux de travail permettant d'optimiser de manière transparente l'agencement des données et le placement mémoire, en limitant les transferts inutiles et les cycles d'horloge perdus.
3. Développer un framework modulaire et accessible, fondé sur un DSL, permettant aux géoscientifiques de décrire leurs chaînes de calcul sans expertise informatique avancée, et intégrant un processus de génération automatique d'un code parallèle performant et économe, adapté à l'architecture cible.
Le cadre applicatif de cette thèse concernera la modélisation géologique qui est aujourd'hui incontournable pour une représentation quantitative du sous-sol. Elle a de nombreuses applications tant dans l'exploitation et la protection des ressources du sous-sol (minéraux, eau, énergie ...) que dans son aménagement (travaux publics, stockage, jumeaux numériques ...). Elle permet en effet de poser les fondations géométriques qui vont contrôler la distribution spatiale des propriétés physiques sur lesquelles vont s'appuyer la simulation de tous les autres processus physiques.
En modélisation géologique, une classe de traitements est particulièrement coûteuses en temps de calcul. Il s'agit de l'évaluation sur les sommets d'un maillage de graphes de type Constructive Solid Geometry, dont chaque nœud est un foncteur implicite. Cette classe de traitements requiert des plateformes de calcul haute performance, en raison de la complexité des calculs et du coût variable de l'évaluation des foncteurs. Plusieurs stratégies de parallélisme peuvent être utilisées et combinées en particulier au niveau des tâches élémentaires et/ou sur l'optimisation de l'évaluation des foncteurs. Un framework de traitements permettant d'exploiter la structure de graphe (souvent arborescente) et les différentes stratégies de parallélisation qui peuvent être combinées permettraient d'adapter la parallélisation et la répartition des calculs aux ressources disponibles, tout en maîtrisant le compromis entre performance et consommation énergétique.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
To meet scientific needs, simulations and numerical processing in geosciences are becoming increasingly complex and computationally intensive. Controlling processing time is therefore one of the key conditions for the applicability of research. Another condition is the management of energy consumption.
The aim of this PhD is to accelerate computations while making them energy-efficient. While reducing execution time directly lowers the energy footprint of each simulation, it is sometimes preferable to seek the optimal performance-to-energy-cost ratio. From this dual perspective, it is important to leverage heterogeneous multi-node architectures combining CPUs, GPUs, and vector units. The objective is to provide a general methodology applicable to a class of processing tasks, going beyond simple portability to define parallelization strategies capable of maximizing the efficiency of each resource while integrating energy consumption constraints.
The PhD project aims to:
1. Design multi-level parallelization strategies adapted to heterogeneous and distributed architectures, combining multi-core CPUs, GPU acceleration, and SIMD vectorization.
2. Optimize task scheduling and distribution to reduce energy costs and maximize overall efficiency. This optimization will take into account the characteristics of computations (granularity, dependencies, irregularity) and will rely on a workflow enabling transparent optimization of data layout and memory placement, while minimizing unnecessary data transfers and wasted clock cycles.
3. Develop a modular and accessible framework, based on a DSL, enabling geoscientists to describe their computational pipelines without requiring advanced programming expertise, and integrating an automatic code generation process to produce efficient and energy-saving parallel code adapted to the target architecture.
The application context of this PhD concerns geological modeling, which is now essential for a quantitative representation of the subsurface. It has numerous applications in both the exploitation and protection of subsurface resources (minerals, water, energy, etc.) and in its development (civil engineering, storage, digital twins, etc.). It provides the geometric foundations that control the spatial distribution of physical properties on which the simulation of all other physical processes relies.
In geological modeling, one class of processing is particularly computationally expensive: the evaluation at mesh vertices of graph-based representations of the Constructive Solid Geometry type, where each node is an implicit function. This class of processing requires high-performance computing platforms due to the complexity of the calculations and the variable cost of evaluating the functions. Several parallelization strategies can be used and combined, particularly at the level of elementary tasks and/or in optimizing function evaluation. A processing framework capable of exploiting the graph structure (often tree-like) and the various combinable parallelization strategies would make it possible to adapt parallelization and workload distribution to available resources, while maintaining control over the trade-off between performance and energy consumption.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Nature du financement
Autre financement public
Précisions sur le financement
ANR Financement d'Agences de financement de la recherche
Présentation établissement et labo d'accueil
Université d'Orléans
Etablissement délivrant le doctorat
Université d'Orléans
Ecole doctorale
551 Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes - MIPTIS
Profil du candidat
Master en Informatique ayant une appétence pour le développement d'algorithmes et l'optimisation de code. Des compétences en géostatistique, géophysique et/ou modélisation 3D seraient un plus.
Master's degree in Computer Science with a strong interest in algorithm development and code optimization. Skills in geostatistics, geophysics, and/or 3D modeling would be a plus.
Master's degree in Computer Science with a strong interest in algorithm development and code optimization. Skills in geostatistics, geophysics, and/or 3D modeling would be a plus.
17/05/2026
Postuler
Fermer
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
Laboratoire National de Métrologie et d'Essais - LNE
ADEME
TotalEnergies
Tecknowmetrix
SUEZ
Nantes Université
Nokia Bell Labs France
ONERA - The French Aerospace Lab
Groupe AFNOR - Association française de normalisation
Généthon
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
ANRT
Servier
Medicen Paris Region
Institut Sup'biotech de Paris
Ifremer
Aérocentre, Pôle d'excellence régional
