CIFRE Stellantis - Extended, Adaptive and Dependable Graph RAG with Knowledge Graph for Compliance, Optimization, and Digital Continuity
ABG-133711 | Sujet de Thèse | |
07/10/2025 | Cifre |
- Mathématiques
- Informatique
- Sciences de l’ingénieur
Description du sujet
Les systèmes RAG (Retrieval Augmented Generator) sont une des applications les plus déployées et visibles des Large Language Models (LLM). L’ambition est de réduire les défauts des LLMs, en particulier les hallucinations et d’améliorer la pertinence des résultats en contraignant les recherches à un espace de documents spécifiques et spécialisés. Les performances restent cependant limitées et nous nous intéressons est l’intégration de graphes de connaissances dans le système. Cette approche est exploitée avec un certain succès et donne lieu au système GraphRAG pour lesquels il existe plusieurs implémentations possibles.
Une limitation essentielle de cette dernière approche est la disponibilité et la qualité du graphe de connaissances utilisé. C’est l’objet de la thèse de travailler à la construction de graphes de connaissances à partir de bases documentaires à l’aide d’IA générative (LLM), et d’intégrer ces graphes dans les processus d’Information Retrieval et d’Inférence de ces GraphRAG.
Parmi les verrous scientifiques se trouvent la quantification et la propagation de l’incertitude issue de cette reconstruction du graphe au sein de GraphRAG, et la capacité à fournir à l’utilisateur final une réponse explicable, avec une mesure de l’incertitude associée. L’évaluation du graphe sera un autre verrou scientifique critique, ainsi que l’améliorer des capacités de raisonnement du LLM dans ces conditions. Enfin, nous aborderons le cycle de vie du système et la problématique de la mise à jour en continu du graphe de connaissances.
La thèse se déroule au LaMME et chez Stellantis, et a pour ambition de développer des méthodologies, des technologies et des prototypes, qui permettront de passer à l’échelle, et de traiter les systèmes industriels de très grande dimension, avec une fiabilité maîtrisée.
Nature du financement
Précisions sur le financement
Présentation établissement et labo d'accueil
http://www.math-evry.cnrs.fr
Profil du candidat
M2 ou Ecole d’ingénieurs en maths/info (IA, Machine Learning, Computer Science…).
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
PhDOOC
CASDEN
ANRT
Institut Sup'biotech de Paris
Nokia Bell Labs France
MabDesign
Laboratoire National de Métrologie et d'Essais - LNE
Aérocentre, Pôle d'excellence régional
MabDesign
Généthon
ONERA - The French Aerospace Lab
ADEME
TotalEnergies
Tecknowmetrix
CESI
SUEZ
Ifremer
Groupe AFNOR - Association française de normalisation
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège