Où docteurs et entreprises se rencontrent
Menu
Connexion

Stratégies de parallélisation éco-efficiente pour le calcul haute performance en géosciences // Eco-efficient parallelization strategies for high-performance computing in the geosciences

ABG-137386
ADUM-73017
Sujet de Thèse
31/03/2026 Autre financement public
Université d'Orléans
ORLEANS - Centre Val de Loire - France
Stratégies de parallélisation éco-efficiente pour le calcul haute performance en géosciences // Eco-efficient parallelization strategies for high-performance computing in the geosciences
  • Informatique
parallelisme, calcul haute performance, géosciences, eco-efficience
parallelism, high performance computing, geosciences, eco-efficiency

Description du sujet

Pour répondre aux besoins scientifiques, les simulations et traitements numériques en géosciences deviennent de plus en plus complexes et intensifs en calcul. Ainsi, contenir les temps de traitement est l'une des conditions de la capacité applicative de la recherche. L'autre condition est la maîtrise de la consommation énergétique.
Cette thèse a pour objet d'accélérer les calculs et de les rendre éco-efficients. Si réduire le temps d'exécution permet de diminuer directement l'empreinte énergétique de chaque simulation, il est parfois préférable de chercher le bon ratio performance/coût énergétique. Dans cette double perspective, il est important de tirer parti des architectures multi-nœuds hétérogènes, combinant CPU, GPU et unités vectorielles. L'objectif est de fournir une méthodologie générale qui sera applicable à une classe de traitements avec, au-delà de la simple portabilité, l'enjeu de définir des stratégies de parallélisation capables de maximiser l'efficacité de chaque ressource, tout en intégrant les contraintes de consommation énergétique.
Le projet de thèse vise à
1. Concevoir des stratégies de parallélisation multi-niveaux, adaptées à des architectures hétérogènes et distribuées, combinant CPU multi-cœurs, accélération GPU et vectorisation SIMD.
2. Optimiser l'ordonnancement et la répartition des tâches afin de réduire les coûts énergétiques et de maximiser l'efficacité globale. Cette optimisation prendra en compte les caractéristiques des calculs (granularité, dépendances, irrégularité) et s'appuiera sur un flux de travail permettant d'optimiser de manière transparente l'agencement des données et le placement mémoire, en limitant les transferts inutiles et les cycles d'horloge perdus.
3. Développer un framework modulaire et accessible, fondé sur un DSL, permettant aux géoscientifiques de décrire leurs chaînes de calcul sans expertise informatique avancée, et intégrant un processus de génération automatique d'un code parallèle performant et économe, adapté à l'architecture cible.
Le cadre applicatif de cette thèse concernera la modélisation géologique qui est aujourd'hui incontournable pour une représentation quantitative du sous-sol. Elle a de nombreuses applications tant dans l'exploitation et la protection des ressources du sous-sol (minéraux, eau, énergie ...) que dans son aménagement (travaux publics, stockage, jumeaux numériques ...). Elle permet en effet de poser les fondations géométriques qui vont contrôler la distribution spatiale des propriétés physiques sur lesquelles vont s'appuyer la simulation de tous les autres processus physiques.
En modélisation géologique, une classe de traitements est particulièrement coûteuses en temps de calcul. Il s'agit de l'évaluation sur les sommets d'un maillage de graphes de type Constructive Solid Geometry, dont chaque nœud est un foncteur implicite. Cette classe de traitements requiert des plateformes de calcul haute performance, en raison de la complexité des calculs et du coût variable de l'évaluation des foncteurs. Plusieurs stratégies de parallélisme peuvent être utilisées et combinées en particulier au niveau des tâches élémentaires et/ou sur l'optimisation de l'évaluation des foncteurs. Un framework de traitements permettant d'exploiter la structure de graphe (souvent arborescente) et les différentes stratégies de parallélisation qui peuvent être combinées permettraient d'adapter la parallélisation et la répartition des calculs aux ressources disponibles, tout en maîtrisant le compromis entre performance et consommation énergétique.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

To meet scientific needs, simulations and numerical processing in geosciences are becoming increasingly complex and computationally intensive. Controlling processing time is therefore one of the key conditions for the applicability of research. Another condition is the management of energy consumption.
The aim of this PhD is to accelerate computations while making them energy-efficient. While reducing execution time directly lowers the energy footprint of each simulation, it is sometimes preferable to seek the optimal performance-to-energy-cost ratio. From this dual perspective, it is important to leverage heterogeneous multi-node architectures combining CPUs, GPUs, and vector units. The objective is to provide a general methodology applicable to a class of processing tasks, going beyond simple portability to define parallelization strategies capable of maximizing the efficiency of each resource while integrating energy consumption constraints.
The PhD project aims to:
1. Design multi-level parallelization strategies adapted to heterogeneous and distributed architectures, combining multi-core CPUs, GPU acceleration, and SIMD vectorization.
2. Optimize task scheduling and distribution to reduce energy costs and maximize overall efficiency. This optimization will take into account the characteristics of computations (granularity, dependencies, irregularity) and will rely on a workflow enabling transparent optimization of data layout and memory placement, while minimizing unnecessary data transfers and wasted clock cycles.
3. Develop a modular and accessible framework, based on a DSL, enabling geoscientists to describe their computational pipelines without requiring advanced programming expertise, and integrating an automatic code generation process to produce efficient and energy-saving parallel code adapted to the target architecture.
The application context of this PhD concerns geological modeling, which is now essential for a quantitative representation of the subsurface. It has numerous applications in both the exploitation and protection of subsurface resources (minerals, water, energy, etc.) and in its development (civil engineering, storage, digital twins, etc.). It provides the geometric foundations that control the spatial distribution of physical properties on which the simulation of all other physical processes relies.
In geological modeling, one class of processing is particularly computationally expensive: the evaluation at mesh vertices of graph-based representations of the Constructive Solid Geometry type, where each node is an implicit function. This class of processing requires high-performance computing platforms due to the complexity of the calculations and the variable cost of evaluating the functions. Several parallelization strategies can be used and combined, particularly at the level of elementary tasks and/or in optimizing function evaluation. A processing framework capable of exploiting the graph structure (often tree-like) and the various combinable parallelization strategies would make it possible to adapt parallelization and workload distribution to available resources, while maintaining control over the trade-off between performance and energy consumption.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/10/2026

Nature du financement

Autre financement public

Précisions sur le financement

ANR Financement d'Agences de financement de la recherche

Présentation établissement et labo d'accueil

Université d'Orléans

Etablissement délivrant le doctorat

Université d'Orléans

Ecole doctorale

551 Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes - MIPTIS

Profil du candidat

Master en Informatique ayant une appétence pour le développement d'algorithmes et l'optimisation de code. Des compétences en géostatistique, géophysique et/ou modélisation 3D seraient un plus.
Master's degree in Computer Science with a strong interest in algorithm development and code optimization. Skills in geostatistics, geophysics, and/or 3D modeling would be a plus.
17/05/2026
Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?