Amélioration des performances d'apprentissage automatique évolutionnaires: application aux problèmes de classification pour la cyber-sécurité. // Improving the performance of evolutionary machine learning: application to classification for cybersecurity
|
ABG-139311
ADUM-74965 |
Thesis topic | |
| 2026-05-28 |
Université du Littoral Côte d'Opale
Calais cedex - Les Hauts de France - France
Amélioration des performances d'apprentissage automatique évolutionnaires: application aux problèmes de classification pour la cyber-sécurité. // Improving the performance of evolutionary machine learning: application to classification for cybersecurity
- Computer science
Apprentissage automatique, Intelligence Artificielle, Programmation Génétique, Réseaux de programmes, Cybersécurité
Machine Learning, Artificial Intelligence, Genetic Programming, Program Graphs, cyber-security
Machine Learning, Artificial Intelligence, Genetic Programming, Program Graphs, cyber-security
Topic description
La classification supervisée est un problème central de l'apprentissage automatique, avec des applications dans de nombreux domaines critiques. Si les approches d'apprentissage profond dominent aujourd'hui de nombreux benchmarks, elles présentent toutefois des limites
importantes en termes de coût computationnel, de dépendance aux données annotées et surtout d'explicabilité. Dans ce contexte, les processus évolutionnaires constituent une alternative particulièrement pertinente, car ils permettent une exploration combinatoire de l'espace des modèles et l'optimisation directe d'objectifs complexes, sans hypothèse de différentiabilité.
Cette thèse vise à développer des méthodes d'apprentissage automatique évolutionnaires performantes et explicables pour la classification, en s'appuyant sur des représentations avancées de type réseaux (ou graphes) de programmes. Ces structures, plus expressives que les représentations arborescentes classiques de la programmation génétique, permettent de contrôler la complexité des modèles, de factoriser les calculs et d'améliorer la performance tout en conservant une forte capacité d'explication. Un enjeu central du travail portera sur la réduction du coût d'évaluation des individus, à travers des stratégies d'évaluation partielle, de sélection adaptative d'exemples informatifs, de modèles surrogate et de caractérisation fine des individus.
La thèse explorera également l'utilisation de représentations vectorielles (embeddings) comme information auxiliaire pour guider les processus évolutionnaires, notamment pour orienter la sélection, la variation et le transfert de connaissances entre problèmes de classification similaires. La cyber-sécurité constituera un cadre applicatif pour valider les méthodes proposées, en raison de ses contraintes fortes en termes de robustesse, d'explicabilité et de frugalité.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Supervised classification is a central problem in machine learning, with applications in many critical domains. While deep learning approaches currently dominate many benchmarks, they nevertheless exhibit significant limitations in terms of computational cost, reliance on large volumes of annotated data, and, above all, lack of explainability. In this context, evolutionary processes constitute a particularly relevant alternative, as they enable a combinatorial exploration of the model space and the direct optimization of complex objectives, without relying on differentiability assumptions.
This thesis aims to develop efficient and explainable evolutionary machine learning methods for classification, relying on advanced representations such as program graphs. These structures, which are more expressive than the classical tree-based representations of genetic programming, allow for controlling model complexity, factorizing computations, and improving performance while preserving a strong explanatory capability. A central hallenge
addressed in this work is the reduction of the cost of individual evaluation, through strategies such as partial evaluation, adaptive selection of informative samples, surrogate models, and fine-grained characterization of individuals.
The thesis will also explore the use of vector representations (embeddings) as auxiliary information to guide evolutionary processes, in particular to steer selection, variation, and knowledge transfer between related classification problems. Cybersecurity will serve as an application framework to validate the proposed methods, due to its strong constraints in terms
of robustness, explainability, and computational frugality.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
importantes en termes de coût computationnel, de dépendance aux données annotées et surtout d'explicabilité. Dans ce contexte, les processus évolutionnaires constituent une alternative particulièrement pertinente, car ils permettent une exploration combinatoire de l'espace des modèles et l'optimisation directe d'objectifs complexes, sans hypothèse de différentiabilité.
Cette thèse vise à développer des méthodes d'apprentissage automatique évolutionnaires performantes et explicables pour la classification, en s'appuyant sur des représentations avancées de type réseaux (ou graphes) de programmes. Ces structures, plus expressives que les représentations arborescentes classiques de la programmation génétique, permettent de contrôler la complexité des modèles, de factoriser les calculs et d'améliorer la performance tout en conservant une forte capacité d'explication. Un enjeu central du travail portera sur la réduction du coût d'évaluation des individus, à travers des stratégies d'évaluation partielle, de sélection adaptative d'exemples informatifs, de modèles surrogate et de caractérisation fine des individus.
La thèse explorera également l'utilisation de représentations vectorielles (embeddings) comme information auxiliaire pour guider les processus évolutionnaires, notamment pour orienter la sélection, la variation et le transfert de connaissances entre problèmes de classification similaires. La cyber-sécurité constituera un cadre applicatif pour valider les méthodes proposées, en raison de ses contraintes fortes en termes de robustesse, d'explicabilité et de frugalité.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Supervised classification is a central problem in machine learning, with applications in many critical domains. While deep learning approaches currently dominate many benchmarks, they nevertheless exhibit significant limitations in terms of computational cost, reliance on large volumes of annotated data, and, above all, lack of explainability. In this context, evolutionary processes constitute a particularly relevant alternative, as they enable a combinatorial exploration of the model space and the direct optimization of complex objectives, without relying on differentiability assumptions.
This thesis aims to develop efficient and explainable evolutionary machine learning methods for classification, relying on advanced representations such as program graphs. These structures, which are more expressive than the classical tree-based representations of genetic programming, allow for controlling model complexity, factorizing computations, and improving performance while preserving a strong explanatory capability. A central hallenge
addressed in this work is the reduction of the cost of individual evaluation, through strategies such as partial evaluation, adaptive selection of informative samples, surrogate models, and fine-grained characterization of individuals.
The thesis will also explore the use of vector representations (embeddings) as auxiliary information to guide evolutionary processes, in particular to steer selection, variation, and knowledge transfer between related classification problems. Cybersecurity will serve as an application framework to validate the proposed methods, due to its strong constraints in terms
of robustness, explainability, and computational frugality.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Funding category
Funding further details
Enseignement supérieur
Presentation of host institution and host laboratory
Université du Littoral Côte d'Opale
Institution awarding doctoral degree
Université du Littoral Côte d'Opale
Graduate school
585 Sciences, Technologie, Santé
Candidate's profile
Le candidat devra posséder de solides compétences en informatique, notamment en intelligence artificielle, apprentissage automatique et algorithmique. Des connaissances en optimisation, algorithmes évolutionnaires ou programmation génétique seront appréciées. Une bonne maîtrise de la programmation scientifique (Python/C++), des outils expérimentaux et de l'anglais scientifique est attendue.
Le candidat devra également faire preuve d'autonomie, de rigueur scientifique et d'un intérêt pour la recherche académique.
The candidate should have strong skills in computer science, particularly in artificial intelligence, machine learning, and algorithms. Knowledge in optimization, evolutionary algorithms, or genetic programming will be appreciated. A good command of scientific programming (Python/C++), experimental tools, and scientific English is expected. The candidate should also demonstrate autonomy, scientific rigor, and a strong interest in academic research.
The candidate should have strong skills in computer science, particularly in artificial intelligence, machine learning, and algorithms. Knowledge in optimization, evolutionary algorithms, or genetic programming will be appreciated. A good command of scientific programming (Python/C++), experimental tools, and scientific English is expected. The candidate should also demonstrate autonomy, scientific rigor, and a strong interest in academic research.
2026-05-31
Apply
Close
Vous avez déjà un compte ?
Nouvel utilisateur ?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
Généthon
ONERA - The French Aerospace Lab
Aérocentre, Pôle d'excellence régional
TotalEnergies
Laboratoire National de Métrologie et d'Essais - LNE
Institut Sup'biotech de Paris
SUEZ
ADEME
Nantes Université
Groupe AFNOR - Association française de normalisation
Servier
Nokia Bell Labs France
Ifremer
Medicen Paris Region
Tecknowmetrix
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
ANRT


