Where PhDs and companies meet
Menu
Login

IA de Confiance pour l'Aide à la Décision Clinique: Agents Augmentés par Graphes de Connaissances et Contrats Sémantiques // Trustworthy AI for Clinical Decision Support: Knowledge Graph-Augmented Agents with Semantic Contracts

ABG-138820
ADUM-74479
Thesis topic
2026-04-30
Université Marie et Louis Pasteur
BESANCON CEDEX - Bourgogne-Franche-Comté - France
IA de Confiance pour l'Aide à la Décision Clinique: Agents Augmentés par Graphes de Connaissances et Contrats Sémantiques // Trustworthy AI for Clinical Decision Support: Knowledge Graph-Augmented Agents with Semantic Contracts
  • Computer science
IA de Confiance, Graphe de Connaissances Médicales, Contrat Sémantique, LLM
Trustworthy AI, Medical Knowledge Graph, Semantic Contract, LLM

Topic description

Cette thèse propose un middleware neuro-symbolique qui empêche l'interprétation directe par des LLM de dossiers médicaux électroniques (DME) bruts ou de données médicales. Dans cette conception, les agents LLM interagissent exclusivement via une API sémantique clinique adossée à un graphe de connaissances médical formel et régie par des contrats sémantiques.

Un principe de conception critique est que cette architecture est indépendante des tâches. La même couche ontologique et le même catalogue de contrats gouvernent la récupération des données, la génération de comptes rendus de sortie, le codage clinique automatisé (CIM-10/CCAM), la vérification des interactions médicamenteuses et l'audit de conformité des parcours de soins. Les contrats définissent ce que l'agent est autorisé à savoir et à faire — et non le type de tâche qu'il exécute. En déplaçant le raisonnement clinique vers un graphe de connaissances déterministe, l'architecture comble également l'écart de capacités des modèles plus petits, souverains et déployés sur site [5, 11].

La thèse explorera deux axes de recherche interdépendants. Leur périmètre précis, leur priorisation et leur méthodologie seront affinés lors de la phase initiale de revue de littérature, en collaboration avec le doctorant. Les axes ci-dessous constituent une feuille de route, et non une prescription rigide.

Construction du graphe de connaissances cliniques. Comment construire automatiquement et enrichir en continu un graphe de connaissances médical à partir de données cliniques françaises hétérogènes — codes structurés (CIM-10, CCAM, ATC), DME semi-structurés et notes médicales non structurées ? La recherche examinera comment les LLM peuvent soutenir l'extraction automatique d'informations et comment les connaissances obtenues peuvent être structurées en représentations standardisées et interopérables compatibles avec les modèles de données de santé établis (FHIR, OMOP, SNOMED-CT, LOINC) [6, 7, 10]. Garantir la qualité, la cohérence et la validité clinique du graphe de connaissances construit constitue une question centrale encore ouverte.

Agents LLM contraints via des contrats sémantiques. Comment concevoir et évaluer des agents LLM dont les limites opérationnelles sont strictement régies par des contrats formels ? La thèse explorera des formalismes tels que les contrats d'agents [8] — des tuples unifiant spécifications d'entrée/sortie, contraintes de schéma, règles cliniques, exigences de traçabilité et contraintes réglementaires (RGPD) — et les évaluera sur plusieurs types de tâches cliniques (recherche d'information, génération de rapports, codage clinique, vérification des interactions médicamenteuses) afin d'évaluer l'universalité de l'approche pilotée par les contrats. Les principales dimensions d'évaluation incluent la réduction du taux d'hallucinations, la précision clinique, la traçabilité du raisonnement et la latence des réponses par rapport à des bases de référence non contraintes.

Stratégie de validation :
L'évaluation ira au-delà des métriques NLP standard (BLEU, ROUGE) pour se concentrer sur la fiabilité et la sécurité cliniques. Le doctorant définira des protocoles d'évaluation cliniquement pertinents, incluant des évaluations de la cohérence clinique par rapport aux recommandations établies, les taux de violation des contrats, l'exhaustivité de la traçabilité et des comparaisons avec des LLM non contraints dans des scénarios cliniques réalistes. Une évaluation avec intervention humaine (human-in-the-loop) mesurera l'utilité du système comme outil d'aide à la décision augmentée. Le système final devra préserver l'autorité décisionnelle complète du clinicien ; l'IA fournissant une couche analytique traçable plutôt que des prescriptions autonomes.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

This thesis proposes a neuro-symbolic middleware that prevents direct LLM interpretation of raw EHR or medical data. In this design, LLM agents interact exclusively through a Clinical Semantic API backed by a formal Medical Knowledge Graph and governed by Semantic Contracts.
A critical design principle is that this architecture is task-agnostic. The same ontology layer and contract catalogue governs data retrieval, discharge report generation, automated clinical coding (CIM-10/CCAM), drug interaction checking, and care pathway compliance auditing. The contracts define what the agent is allowed to know and do—not what kind of task it performs. By shifting clinical reasoning into a deterministic knowledge graph, the architecture also addresses the capability gap of smaller, sovereign, on-premise models [5, 11].
The thesis will explore two interrelated research directions. Their precise scope, prioritization, and methodology will be refined during the initial literature review phase, in collaboration with the candidate. The directions below represent a roadmap, not a rigid prescription.
Clinical Knowledge Graph construction. How to automatically build and continuously enrich a medical Knowledge Graph from heterogeneous French clinical data—structured codes (CIM-10, CCAM, ATC), semi-structured EHRs, and unstructured physician notes? The research will investigate how LLMs can support automated information extraction and how the resulting knowledge can be structured into standardized, interoperable representations compatible with established healthcare data models (FHIR, OMOP, SNOMED-CT, LOINC) [6, 7, 10]. Ensuring quality, consistency, and clinical validity of the constructed KG is a central open question.
Constrained LLM agents via Semantic Contracts. How to design and evaluate LLM agents whose operational boundaries are strictly governed by formal contracts? The thesis will explore formalisms such as Agent Contracts [8]—tuples that unify input/output specifications, schema constraints, clinical rules, traceability requirements, and regulatory constraints (RGPD)—and evaluate them across multiple clinical task types (retrieval, report generation, clinical coding, drug interaction checking) to assess the universality of the contract-driven approach. Key evaluation dimensions include hallucination rate reduction, clinical accuracy, traceability of reasoning, and response latency compared to unconstrained baselines.

Validation Strategy:
Evaluation will go beyond standard NLP metrics (BLEU, ROUGE) to focus on clinical reliability and safety. The candidate will define clinically meaningful evaluation protocols, including assessments of clinical consistency against established guidelines, rates of contract violations, completeness of traceability, and comparisons with unconstrained LLM baselines in realistic clinical scenarios. A human-in-the-loop evaluation will assess the system's utility as an augmentative decision-support tool. The final system should preserve the clinician's full decision-making authority; the AI provides a traceable analytical layer rather than autonomous prescriptions.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/10/2026

Funding category

Funding further details

Financement d'un établissement public Français

Presentation of host institution and host laboratory

Université Marie et Louis Pasteur

Institution awarding doctoral degree

Université Marie et Louis Pasteur

Graduate school

37 SPIM - Sciences Physiques pour l'Ingénieur et Microtechniques

Candidate's profile

Nous recherchons un candidat titulaire d'un master (au moment de l'inscription en thèse en Octobre 2026) en informatique ou dans un domaine connexe, justifiant d'une expérience avérée dans au moins deux des domaines suivants : traitement du langage naturel, représentation des connaissances et raisonnement (graphes de connaissances, ontologies), architecture logicielle et apprentissage automatique. Une bonne connaissance des normes relatives aux données de santé (FHIR, CIM-10, SNOMED-CT) et des cadres réglementaires (RGPD, loi européenne sur l'IA) est un atout, mais n'est pas obligatoire. De solides compétences en programmation (Python) et la capacité à maîtriser à la fois les techniques de spécification et de vérification formelles (conception par contrat, surveillance d'exécution, satisfaction de contraintes) et l'évaluation empirique sont essentielles. Critères de sélection préférentiels : - Les candidats doivent avoir une expérience en IA – réseaux neuronaux, plus particulièrement les LLM / réseaux profonds, et les frameworks de programmation informatique pour l'apprentissage profond utilisant Python. - Une maîtrise raisonnable de l'anglais (écrit et parlé) est requise. Qualités personnelles : - Compétences interpersonnelles - Dynamisme et rigueur - Capacité à travailler en équipe Les candidats sont invités à envoyer leur candidature aux encadrants de thèse. Le dossier de candidature doit comprendre les documents suivants : - CV - Lettre de motivation - Au moins une lettre de recommandation - Copie du diplôme de master, si déjà disponible - Copie du relevé de notes final et du classement
We are looking for a candidate who holds a Master's degree (at the time of enrollment in the PhD program in October 2026) in Computer Science or a related field, with demonstrated experience in at least two of the following areas: Natural Language Processing, Knowledge Representation and Reasoning (Knowledge Graphs, ontologies), Software Architecture, and Machine Learning. Familiarity with healthcare data standards (FHIR, CIM-10, SNOMED-CT) and regulatory frameworks (GDPR, EU AI Act) is a plus but not required. Strong programming skills (Python) and the ability to engage with both formal specification and verification techniques (design-by-contract, runtime monitoring, constraint satisfaction) and empirical evaluation are essential. Preferred selection criteria: - Applicants should have experience with AI – neural networks, more particularly LLMs / deep networks, and computer programming frameworks for deep learning using Python. - Reasonable proficiency in English (written and spoken) is a requirement. Personal characteristics: - Interpersonal skills - Dynamism and rigor - Teamwork abilities Applicants are invited to submit their application to the PhD supervisors. Application must contain the following documents: - CV - Cover letter - At least 1 reference letter - Copy of Master degree if already available - Copy of final marks and ranks
2026-05-22
Partager via
Apply
Close

Vous avez déjà un compte ?

Nouvel utilisateur ?