Le coût environnemental de la haute disponibilité dans les Datacenters // On the environmental cost of high availability in Datacenters
ABG-132268
ADUM-66357 |
Thesis topic | |
2025-05-28 |
Université Grenoble Alpes
Saint-Martin-d'Hères - Auvergne-Rhône-Alpes - France
Le coût environnemental de la haute disponibilité dans les Datacenters // On the environmental cost of high availability in Datacenters
- Computer science
Systèmes distribués, Impact environnementaux, Haute disponibilité, Cloud computing
Distributed systems, Environmental impacts, High availability, Cloud computing
Distributed systems, Environmental impacts, High availability, Cloud computing
Topic description
Dans le contexte du réchauffement climatique, la réduction des émissions de gaz à effet de serre, et plus généralement de l'impact environnemental des infrastructures informatiques est une priorité absolue. Les centres de données sont responsables d'une part importante des émissions de carbone de l'informatique.
Les centres de données sont au cœur des infrastructures cloud, où sont hébergés la plupart des services en ligne que nous utilisons au quotidien. Les utilisateurs de ces services attendent une qualité de service élevée, notamment une haute disponibilité, permettant aux services d'être toujours prêts à répondre aux demandes des utilisateurs, quelles que soient les défaillances de l'infrastructure. Cependant, fournir de telles garanties a un coût élevé en termes d'empreinte carbone.
Pour fournir un service de haute qualité tout en s'adaptant à un grand nombre d'utilisateurs, les concepteurs d'applications cloud s'appuient sur des approches logicielles complexes. En termes d'infrastructure, des techniques d'orchestration avancées sont utilisées, associées à une surveillance fine. La réplication et le partitionnement sont appliqués à un très grand nombre de services. De tels systèmes deviennent si complexes à maintenir et à mettre à jour qu'il est nécessaire d'adopter des techniques telles que l'ingénierie du chaos pour vérifier que l'infrastructure déployée est réellement capable de gérer les pannes.
Toutes ces techniques nécessitent l'utilisation d'importantes ressources de calcul. Cependant, à ce jour, très peu de travaux ont étudié le lien entre la qualité de service fournie par ces plateformes et leur empreinte carbone. Il s'agit d'une tâche très complexe, car réaliser des évaluations précises nécessite de prendre en compte de nombreux paramètres et de définir un périmètre précis pour le système étudié.
Le premier objectif de cette thèse est de concevoir des méthodes et des outils permettant d'évaluer l'empreinte carbone des techniques de disponibilité dans les centres de données. Ces informations sont importantes car elles peuvent aider les utilisateurs, les concepteurs d'applications et les opérateurs du Cloud à prendre en compte l'impact environnemental dans leurs processus de décision. Plus précisément, l'objectif sera de comprendre le coût environnemental des différentes techniques de haute disponibilité matérielles et logicielles, et de le relier aux bénéfices attendus en termes de disponibilité.
Le deuxième objectif est de capitaliser sur les connaissances acquises lors de la première partie du doctorat, pour adapter les approches de disponibilité existantes voire de proposer de nouvelles techniques dans le but de réduire le coût environnemental de la haute disponibilité.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
In the context of global warming, reducing the carbon emissions, and more generally the environmental impact, of computer infrastructures is a top priority. Datacenters are responsible for a large fraction of the carbon emissions of IT.
Datacenters are at the core of Cloud infrastructures where most online services that we use in our every day life are hosted. Users of these services expect high quality of service. This includes high availability where services should always be ready to answer user requests no matter the failures experienced by the infrastructure. However, providing such guarantees has a high cost in terms of carbon footprint.
To provide a high quality of service while scaling to large number of users, designers of Cloud applications rely on complex software approaches. In terms of infrastructure, advanced orchestration techniques are used together with fine-grain monitoring. Replication and partitioning are applied to very large number of services. Such systems become so complex to maintain and update that techniques such as chaos engineering need to be adopted to verify that the deployed infrastructure is really able to deal with failures.
All these techniques require using significant amount of computing resources. However, as of today, very few work have studied the link between the quality of service provided by such platforms and their carbon footprint. This is a very difficult task as making accurate evaluations require taking into account many parameters and defining a precise perimeter for the studied system.
The first objective of this PhD thesis is to design methods and tools to evaluate the carbon footprint of availability techniques in data centers. Such information is important as it can help Cloud users, designers, and operators, taking environmental impact into account in their decision process. More specifically, the goal will be to understand the environmental cost of different hardware and software high availability techniques, and to relate this cost to the expected benefits in terms of availability.
The second objective is to leverage the knowledge acquired during the first part of the PhD, to amend existing availability approaches or even to propose new techniques with the goal of reducing the environmental cost of high availability.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
Les centres de données sont au cœur des infrastructures cloud, où sont hébergés la plupart des services en ligne que nous utilisons au quotidien. Les utilisateurs de ces services attendent une qualité de service élevée, notamment une haute disponibilité, permettant aux services d'être toujours prêts à répondre aux demandes des utilisateurs, quelles que soient les défaillances de l'infrastructure. Cependant, fournir de telles garanties a un coût élevé en termes d'empreinte carbone.
Pour fournir un service de haute qualité tout en s'adaptant à un grand nombre d'utilisateurs, les concepteurs d'applications cloud s'appuient sur des approches logicielles complexes. En termes d'infrastructure, des techniques d'orchestration avancées sont utilisées, associées à une surveillance fine. La réplication et le partitionnement sont appliqués à un très grand nombre de services. De tels systèmes deviennent si complexes à maintenir et à mettre à jour qu'il est nécessaire d'adopter des techniques telles que l'ingénierie du chaos pour vérifier que l'infrastructure déployée est réellement capable de gérer les pannes.
Toutes ces techniques nécessitent l'utilisation d'importantes ressources de calcul. Cependant, à ce jour, très peu de travaux ont étudié le lien entre la qualité de service fournie par ces plateformes et leur empreinte carbone. Il s'agit d'une tâche très complexe, car réaliser des évaluations précises nécessite de prendre en compte de nombreux paramètres et de définir un périmètre précis pour le système étudié.
Le premier objectif de cette thèse est de concevoir des méthodes et des outils permettant d'évaluer l'empreinte carbone des techniques de disponibilité dans les centres de données. Ces informations sont importantes car elles peuvent aider les utilisateurs, les concepteurs d'applications et les opérateurs du Cloud à prendre en compte l'impact environnemental dans leurs processus de décision. Plus précisément, l'objectif sera de comprendre le coût environnemental des différentes techniques de haute disponibilité matérielles et logicielles, et de le relier aux bénéfices attendus en termes de disponibilité.
Le deuxième objectif est de capitaliser sur les connaissances acquises lors de la première partie du doctorat, pour adapter les approches de disponibilité existantes voire de proposer de nouvelles techniques dans le but de réduire le coût environnemental de la haute disponibilité.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
In the context of global warming, reducing the carbon emissions, and more generally the environmental impact, of computer infrastructures is a top priority. Datacenters are responsible for a large fraction of the carbon emissions of IT.
Datacenters are at the core of Cloud infrastructures where most online services that we use in our every day life are hosted. Users of these services expect high quality of service. This includes high availability where services should always be ready to answer user requests no matter the failures experienced by the infrastructure. However, providing such guarantees has a high cost in terms of carbon footprint.
To provide a high quality of service while scaling to large number of users, designers of Cloud applications rely on complex software approaches. In terms of infrastructure, advanced orchestration techniques are used together with fine-grain monitoring. Replication and partitioning are applied to very large number of services. Such systems become so complex to maintain and update that techniques such as chaos engineering need to be adopted to verify that the deployed infrastructure is really able to deal with failures.
All these techniques require using significant amount of computing resources. However, as of today, very few work have studied the link between the quality of service provided by such platforms and their carbon footprint. This is a very difficult task as making accurate evaluations require taking into account many parameters and defining a precise perimeter for the studied system.
The first objective of this PhD thesis is to design methods and tools to evaluate the carbon footprint of availability techniques in data centers. Such information is important as it can help Cloud users, designers, and operators, taking environmental impact into account in their decision process. More specifically, the goal will be to understand the environmental cost of different hardware and software high availability techniques, and to relate this cost to the expected benefits in terms of availability.
The second objective is to leverage the knowledge acquired during the first part of the PhD, to amend existing availability approaches or even to propose new techniques with the goal of reducing the environmental cost of high availability.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
Funding category
Funding further details
Concours allocations
Presentation of host institution and host laboratory
Université Grenoble Alpes
Institution awarding doctoral degree
Université Grenoble Alpes
Graduate school
217 MSTII - Mathématiques, Sciences et technologies de l'information, Informatique
Candidate's profile
Les candidats doivent être titulaire d'un diplome de Maser en informatique, avec une bonne maitrise des systèmes distribués et des infrastructures cloud. Un expérience dans un laboratoire de recherche est requise. Une connaissance des piles logicielles Cloud telles que Kubernetes est un plus
Candidates should have a Master degree in Computer Science with a strong background in distributed systems and Cloud computing. Candidates should have previous experiences in research labs. Some experience with Cloud software stacks such as Kubernetes is a plus.
Candidates should have a Master degree in Computer Science with a strong background in distributed systems and Cloud computing. Candidates should have previous experiences in research labs. Some experience with Cloud software stacks such as Kubernetes is a plus.
2025-06-09
Apply
Close
Vous avez déjà un compte ?
Nouvel utilisateur ?
More information about ABG?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
MabDesign
CESI
Laboratoire National de Métrologie et d'Essais - LNE
TotalEnergies
Tecknowmetrix
MabDesign
Groupe AFNOR - Association française de normalisation
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
SUEZ
Institut Sup'biotech de Paris
ANRT
Généthon
ONERA - The French Aerospace Lab
Ifremer
PhDOOC
ADEME
CASDEN
Aérocentre, Pôle d'excellence régional
Nokia Bell Labs France