Médiation de sécurité et explicabilité contrôlée pour la protection de la confidentialité des modèles de langage en phase d'inférence : proposition d'un mécanisme de contrôle de divulgation sémantique multiniveaux // Security Mediation and Controlled Expl
|
ABG-139493
ADUM-75618 |
Thesis topic | |
| 2026-06-10 | Other public funding |
INSA Centre Val de Loire
ORLEANS - Centre Val de Loire - France
Médiation de sécurité et explicabilité contrôlée pour la protection de la confidentialité des modèles de langage en phase d'inférence : proposition d'un mécanisme de contrôle de divulgation sémantique multiniveaux // Security Mediation and Controlled Expl
- Computer science
confidentialité, modèles de langage de grande taille, filtrage , explicabilité
data protection, Large Language Models, access control, explainability
data protection, Large Language Models, access control, explainability
Topic description
Cette thèse étudie les problèmes de confidentialité lors de l'utilisation des modèles de langage de grande taille (LLM). Le travail de recherche se concentrera sur la phase d'inférence interactive. On supposera que le LLM est une boîte grise. Les attaques considérées visent principalement la confidentialité des données, notamment par l'inférence de l'existence ou
du contenu de documents internes, la reconstruction d'informations sensibles à partir de réponses agrégées, ou la divulgation indirecte via reformulation ou abstraction. La première étape consistera à la définition d'un modèle de menace pour les LLM en
environnement potentiellement adversarial avec l'identification des surfaces de fuite (entrée, génération, sortie, explication) et formalisera les exigences de sécurité telles que la non-divulgation (directe ou indirecte), la robustesse face
aux requêtes adversariales, la notion de niveaux d'abstraction pour une explicabilité contrôlée.
La deuxième phase, qui est le coeur de la thèse, portera sur la conception d'un modèle de médiation de sécurité pour les LLM, intégrant (i) Un filtrage de sécurité des requêtes en entrée. Le cadre sera étendu à un environnement intégrant un module de Retrieval-Augmented
Generation, introduisant la problématique supplémentaire du contrôle d'accès aux sources documentaires. (ii) La conception d'un filtrage de sécurité des réponses générées. Le filtrage des réponses reposera sur une approche hybride combinant la reconnaissance d'entités sensibles spécifiques au domaine et un classifieur global de sensibilité
sémantique. (iii) Un mécanisme d'explication contrôlée permettant de fournir des justifications vérifiables à un niveau d'abstraction maîtrisé, distinctes des traces complètes réservées à l'audit interne.
Une dernière phase concernera la réalisation d'un outil expérimental développé afin d'implémenter l'architecture proposée autour d'un LLM. Un cas d'étude particulier pourra porter sur un déploiement en environnement d'entreprise avec un système RAG local alimenté par des données sensibles. Les expérimentations viseront à évaluer, selon des métriques de sécurité, d'utilité et d'explicabilité, l'efficacité des filtres ; la pertinence et le niveau d'abstraction des explications générées ; la robustesse du système face à des scénarios d'attaque simulés.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
This thesis focuses on confidentiality issues when using large language models (LLMs). The research work will focus on the interactive inference phase. We will assume that the LLM is a gray box. The attacks considered primarily target data confidentiality, notably through the inference of the existence or
content of internal documents, the reconstruction of sensitive information from aggregated responses, or indirect disclosure via rephrasing or abstraction. The first step will consist of defining a threat model for LLMs in
a potentially adversarial environment, identifying leakage surfaces (input, generation, output, explanation), and formalizing security requirements such as non-disclosure (direct or indirect), robustness against
adversarial queries, and the concept of abstraction levels for controlled explainability.
The second phase, which is the core of the thesis, will focus on the design of a security mediation model for LLMs, integrating (i) Security filtering of input queries. The framework will be extended to an environment incorporating a Retrieval-Augmented
Generation module, introducing the additional challenge of controlling access to documentary sources. (ii) The design of security filtering for generated responses. Response filtering will be based on a hybrid approach combining domain-specific recognition of sensitive entities and a global semantic sensitivity classifier. (iii) A controlled explanation mechanism capable of providing verifiable justifications at a controlled level of abstraction, distinct from the complete audit trails reserved for internal auditing.
A final phase will involve the development of an experimental tool designed to implement the proposed architecture around an LLM. A specific case study may focus on a deployment in an enterprise environment with a local RAG system fed by sensitive data. The experiments will aim to evaluate, based on metrics of security, utility, and explainability, the effectiveness of the filters; the relevance and level of abstraction of the generated explanations; and the system's robustness against simulated attack scenarios.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
WEB : https://www.univ-orleans.fr/lifo/membres/bertolissi/sujet_Safe_LLM.pdf
du contenu de documents internes, la reconstruction d'informations sensibles à partir de réponses agrégées, ou la divulgation indirecte via reformulation ou abstraction. La première étape consistera à la définition d'un modèle de menace pour les LLM en
environnement potentiellement adversarial avec l'identification des surfaces de fuite (entrée, génération, sortie, explication) et formalisera les exigences de sécurité telles que la non-divulgation (directe ou indirecte), la robustesse face
aux requêtes adversariales, la notion de niveaux d'abstraction pour une explicabilité contrôlée.
La deuxième phase, qui est le coeur de la thèse, portera sur la conception d'un modèle de médiation de sécurité pour les LLM, intégrant (i) Un filtrage de sécurité des requêtes en entrée. Le cadre sera étendu à un environnement intégrant un module de Retrieval-Augmented
Generation, introduisant la problématique supplémentaire du contrôle d'accès aux sources documentaires. (ii) La conception d'un filtrage de sécurité des réponses générées. Le filtrage des réponses reposera sur une approche hybride combinant la reconnaissance d'entités sensibles spécifiques au domaine et un classifieur global de sensibilité
sémantique. (iii) Un mécanisme d'explication contrôlée permettant de fournir des justifications vérifiables à un niveau d'abstraction maîtrisé, distinctes des traces complètes réservées à l'audit interne.
Une dernière phase concernera la réalisation d'un outil expérimental développé afin d'implémenter l'architecture proposée autour d'un LLM. Un cas d'étude particulier pourra porter sur un déploiement en environnement d'entreprise avec un système RAG local alimenté par des données sensibles. Les expérimentations viseront à évaluer, selon des métriques de sécurité, d'utilité et d'explicabilité, l'efficacité des filtres ; la pertinence et le niveau d'abstraction des explications générées ; la robustesse du système face à des scénarios d'attaque simulés.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
This thesis focuses on confidentiality issues when using large language models (LLMs). The research work will focus on the interactive inference phase. We will assume that the LLM is a gray box. The attacks considered primarily target data confidentiality, notably through the inference of the existence or
content of internal documents, the reconstruction of sensitive information from aggregated responses, or indirect disclosure via rephrasing or abstraction. The first step will consist of defining a threat model for LLMs in
a potentially adversarial environment, identifying leakage surfaces (input, generation, output, explanation), and formalizing security requirements such as non-disclosure (direct or indirect), robustness against
adversarial queries, and the concept of abstraction levels for controlled explainability.
The second phase, which is the core of the thesis, will focus on the design of a security mediation model for LLMs, integrating (i) Security filtering of input queries. The framework will be extended to an environment incorporating a Retrieval-Augmented
Generation module, introducing the additional challenge of controlling access to documentary sources. (ii) The design of security filtering for generated responses. Response filtering will be based on a hybrid approach combining domain-specific recognition of sensitive entities and a global semantic sensitivity classifier. (iii) A controlled explanation mechanism capable of providing verifiable justifications at a controlled level of abstraction, distinct from the complete audit trails reserved for internal auditing.
A final phase will involve the development of an experimental tool designed to implement the proposed architecture around an LLM. A specific case study may focus on a deployment in an enterprise environment with a local RAG system fed by sensitive data. The experiments will aim to evaluate, based on metrics of security, utility, and explainability, the effectiveness of the filters; the relevance and level of abstraction of the generated explanations; and the system's robustness against simulated attack scenarios.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
WEB : https://www.univ-orleans.fr/lifo/membres/bertolissi/sujet_Safe_LLM.pdf
Funding category
Other public funding
Funding further details
ANR Financement d'Agences de financement de la recherche
Presentation of host institution and host laboratory
INSA Centre Val de Loire
Institution awarding doctoral degree
INSA Centre Val de Loire
Graduate school
551 Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes - MIPTIS
Candidate's profile
Le ou la candidat(e) devra être titulaire d'un diplôme de niveau Master (ou équivalent) en informatique, avec de compétences en cybersécurité et intelligence artificielle.
Une bonne maîtrise des concepts fondamentaux liés à la sécurité des systèmes d'information (contrôle d'accès, confidentialité, gestion des risques, protection des données) est attendue.
Le sujet se situant à l'interface entre sécurité, IA et modélisation, le ou la candidat(e) devra faire preuve d'une forte capacité d'analyse et d'abstraction. Des competences en approches formelles, formalisation logique, représentation des connaissances, analyse sémantique, mécanismes de contrôle d'accès, l'explicabilité des systèmes d'IA seront un atout.
Des connaissances en intelligence artificielle, et plus particulièrement en modèles de langage (LLM), en traitement automatique du langage naturel ou en systèmes d'IA générative, seront appréciés.
Sur le plan technique, une bonne maîtrise de la programmation (Python notamment) est attendue. Une expérience en développement logiciel, en expérimentation ou en évaluation de systèmes d'IA constituera un avantage.
Enfin, le ou la candidat(e) devra faire preuve d'autonomie, de rigueur scientifique, de curiosité intellectuelle et d'une capacité à travailler dans un environnement de recherche collaboratif. De bonnes compétences rédactionnelles en français et en anglais seront également appréciées.
The successful candidate should hold a Master's degree (or equivalent) in Computer Science, with competencies in both cybersecurity and artificial intelligence. A solid understanding of the fundamental concepts of information systems security is expected, including risk management and data protection. As the research topic lies at the intersection of security, artificial intelligence, and modeling, the candidate should demonstrate strong analytical and abstraction skills. Experience with formal methods, logical formalization, knowledge representation, semantic analysis, access control mechanisms, and explainability of AI systems will be considered a significant asset. Knowledge of artificial intelligence, and more specifically Large Language Models (LLMs), Natural Language Processing (NLP), or generative AI systems, will be appreciated. From a technical perspective, proficiency in programming, particularly in Python, is expected. Experience in software development, experimentation, or the evaluation of AI systems will be an advantage. Finally, the candidate should demonstrate autonomy, scientific rigor, intellectual curiosity, and the ability to work effectively in a collaborative research environment. Good written communication skills in both French and English will also be appreciated.
The successful candidate should hold a Master's degree (or equivalent) in Computer Science, with competencies in both cybersecurity and artificial intelligence. A solid understanding of the fundamental concepts of information systems security is expected, including risk management and data protection. As the research topic lies at the intersection of security, artificial intelligence, and modeling, the candidate should demonstrate strong analytical and abstraction skills. Experience with formal methods, logical formalization, knowledge representation, semantic analysis, access control mechanisms, and explainability of AI systems will be considered a significant asset. Knowledge of artificial intelligence, and more specifically Large Language Models (LLMs), Natural Language Processing (NLP), or generative AI systems, will be appreciated. From a technical perspective, proficiency in programming, particularly in Python, is expected. Experience in software development, experimentation, or the evaluation of AI systems will be an advantage. Finally, the candidate should demonstrate autonomy, scientific rigor, intellectual curiosity, and the ability to work effectively in a collaborative research environment. Good written communication skills in both French and English will also be appreciated.
2026-07-18
Apply
Close
Vous avez déjà un compte ?
Nouvel utilisateur ?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
Nokia Bell Labs France
Institut Sup'biotech de Paris
Tecknowmetrix
Groupe AFNOR - Association française de normalisation
Ifremer
TotalEnergies
Généthon
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Nantes Université
ONERA - The French Aerospace Lab
SUEZ
Laboratoire National de Métrologie et d'Essais - LNE
ANRT
ADEME
Aérocentre, Pôle d'excellence régional
Servier
Medicen Paris Region


