I am*	↓ ↓
E-mail*	↓ ↓

Back to search results

Médiation de sécurité et explicabilité contrôlée pour la protection de la confidentialité des modèles de langage en phase d'inférence : proposition d'un mécanisme de contrôle de divulgation sémantique multiniveaux // Security Mediation and Controlled Expl

Ref. ABG-139493 ADUM-75618	Thesis topic
2026-06-10		Other public funding

INSA Centre Val de Loire

Workplace

ORLEANS - Centre Val de Loire - France

Topic title

Médiation de sécurité et explicabilité contrôlée pour la protection de la confidentialité des modèles de langage en phase d'inférence : proposition d'un mécanisme de contrôle de divulgation sémantique multiniveaux // Security Mediation and Controlled Expl

Scientific expertise

Computer science

Keywords

confidentialité, modèles de langage de grande taille, filtrage , explicabilité
data protection, Large Language Models, access control, explainability

Topic description

Cette thèse étudie les problèmes de confidentialité lors de l'utilisation des modèles de langage de grande taille (LLM). Le travail de recherche se concentrera sur la phase d'inférence interactive. On supposera que le LLM est une boîte grise. Les attaques considérées visent principalement la confidentialité des données, notamment par l'inférence de l'existence ou
du contenu de documents internes, la reconstruction d'informations sensibles à partir de réponses agrégées, ou la divulgation indirecte via reformulation ou abstraction. La première étape consistera à la définition d'un modèle de menace pour les LLM en
environnement potentiellement adversarial avec l'identification des surfaces de fuite (entrée, génération, sortie, explication) et formalisera les exigences de sécurité telles que la non-divulgation (directe ou indirecte), la robustesse face
aux requêtes adversariales, la notion de niveaux d'abstraction pour une explicabilité contrôlée.
La deuxième phase, qui est le coeur de la thèse, portera sur la conception d'un modèle de médiation de sécurité pour les LLM, intégrant (i) Un filtrage de sécurité des requêtes en entrée. Le cadre sera étendu à un environnement intégrant un module de Retrieval-Augmented
Generation, introduisant la problématique supplémentaire du contrôle d'accès aux sources documentaires. (ii) La conception d'un filtrage de sécurité des réponses générées. Le filtrage des réponses reposera sur une approche hybride combinant la reconnaissance d'entités sensibles spécifiques au domaine et un classifieur global de sensibilité
sémantique. (iii) Un mécanisme d'explication contrôlée permettant de fournir des justifications vérifiables à un niveau d'abstraction maîtrisé, distinctes des traces complètes réservées à l'audit interne.
Une dernière phase concernera la réalisation d'un outil expérimental développé afin d'implémenter l'architecture proposée autour d'un LLM. Un cas d'étude particulier pourra porter sur un déploiement en environnement d'entreprise avec un système RAG local alimenté par des données sensibles. Les expérimentations viseront à évaluer, selon des métriques de sécurité, d'utilité et d'explicabilité, l'efficacité des filtres ; la pertinence et le niveau d'abstraction des explications générées ; la robustesse du système face à des scénarios d'attaque simulés.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

This thesis focuses on confidentiality issues when using large language models (LLMs). The research work will focus on the interactive inference phase. We will assume that the LLM is a gray box. The attacks considered primarily target data confidentiality, notably through the inference of the existence or
content of internal documents, the reconstruction of sensitive information from aggregated responses, or indirect disclosure via rephrasing or abstraction. The first step will consist of defining a threat model for LLMs in
a potentially adversarial environment, identifying leakage surfaces (input, generation, output, explanation), and formalizing security requirements such as non-disclosure (direct or indirect), robustness against
adversarial queries, and the concept of abstraction levels for controlled explainability.
The second phase, which is the core of the thesis, will focus on the design of a security mediation model for LLMs, integrating (i) Security filtering of input queries. The framework will be extended to an environment incorporating a Retrieval-Augmented
Generation module, introducing the additional challenge of controlling access to documentary sources. (ii) The design of security filtering for generated responses. Response filtering will be based on a hybrid approach combining domain-specific recognition of sensitive entities and a global semantic sensitivity classifier. (iii) A controlled explanation mechanism capable of providing verifiable justifications at a controlled level of abstraction, distinct from the complete audit trails reserved for internal auditing.
A final phase will involve the development of an experimental tool designed to implement the proposed architecture around an LLM. A specific case study may focus on a deployment in an enterprise environment with a local RAG system fed by sensitive data. The experiments will aim to evaluate, based on metrics of security, utility, and explainability, the effectiveness of the filters; the relevance and level of abstraction of the generated explanations; and the system's robustness against simulated attack scenarios.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/10/2026
WEB : https://www.univ-orleans.fr/lifo/membres/bertolissi/sujet_Safe_LLM.pdf

Funding category

Other public funding

Funding further details

ANR Financement d'Agences de financement de la recherche

Presentation of host institution and host laboratory

INSA Centre Val de Loire

Institution awarding doctoral degree

INSA Centre Val de Loire

Graduate school

551 Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes - MIPTIS

Candidate's profile

Le ou la candidat(e) devra être titulaire d'un diplôme de niveau Master (ou équivalent) en informatique, avec de compétences en cybersécurité et intelligence artificielle. Une bonne maîtrise des concepts fondamentaux liés à la sécurité des systèmes d'information (contrôle d'accès, confidentialité, gestion des risques, protection des données) est attendue. Le sujet se situant à l'interface entre sécurité, IA et modélisation, le ou la candidat(e) devra faire preuve d'une forte capacité d'analyse et d'abstraction. Des competences en approches formelles, formalisation logique, représentation des connaissances, analyse sémantique, mécanismes de contrôle d'accès, l'explicabilité des systèmes d'IA seront un atout. Des connaissances en intelligence artificielle, et plus particulièrement en modèles de langage (LLM), en traitement automatique du langage naturel ou en systèmes d'IA générative, seront appréciés. Sur le plan technique, une bonne maîtrise de la programmation (Python notamment) est attendue. Une expérience en développement logiciel, en expérimentation ou en évaluation de systèmes d'IA constituera un avantage. Enfin, le ou la candidat(e) devra faire preuve d'autonomie, de rigueur scientifique, de curiosité intellectuelle et d'une capacité à travailler dans un environnement de recherche collaboratif. De bonnes compétences rédactionnelles en français et en anglais seront également appréciées.
The successful candidate should hold a Master's degree (or equivalent) in Computer Science, with competencies in both cybersecurity and artificial intelligence. A solid understanding of the fundamental concepts of information systems security is expected, including risk management and data protection. As the research topic lies at the intersection of security, artificial intelligence, and modeling, the candidate should demonstrate strong analytical and abstraction skills. Experience with formal methods, logical formalization, knowledge representation, semantic analysis, access control mechanisms, and explainability of AI systems will be considered a significant asset. Knowledge of artificial intelligence, and more specifically Large Language Models (LLMs), Natural Language Processing (NLP), or generative AI systems, will be appreciated. From a technical perspective, proficiency in programming, particularly in Python, is expected. Experience in software development, experimentation, or the evaluation of AI systems will be an advantage. Finally, the candidate should demonstrate autonomy, scientific rigor, intellectual curiosity, and the ability to work effectively in a collaborative research environment. Good written communication skills in both French and English will also be appreciated.

Application deadline

2026-07-18

Partager via

Apply

Vous avez déjà un compte ?

Nouvel utilisateur ?

Mr/Mrs*	↓ ↓
First name*	↓ ↓
Last name*	↓ ↓
E-mail*	↓ ↓
Confirm your e-mail*	↓ ↓
Password*	8 characters minimum, including at least one figure, one lower case letter and one uppercase letter. ↓ ↓
Please confirm password*	↓ ↓