IA fédérative sur un réseau de caméras intelligentes sans fil
| ABG-138896 | Thesis topic | |
| 2026-05-05 | Other public funding |
- Engineering sciences
- Computer science
Topic description
Avec la prolifération des capteurs visuels intelligents, les réseaux de caméras sans fil deviennent un domaine de recherche essentiel pour de nombreuses applications, telles que la surveillance, la reconnaissance d'objets et l'analyse de scènes en temps réel. Cependant, l'optimisation du traitement des données et de leur transmission reste un défi majeur en raison des contraintes de bande passante, de consommation d'énergie et de capacité de calcul des capteurs embarqués. Dans une logique de frugalité, cette thèse propose une architecture distribuée originale reposant sur l'intelligence artificielle fédérative et un mécanisme de registre distribué fondé sur des représentations latentes, afin d'optimiser les échanges d'informations dans le réseau tout en garantissant la confidentialité et la traçabilité des données.
Pour préserver la vie privée des individus, les caméras utilisées sont de très basse résolution (32×32 pixels), réduisant ainsi le risque d'identification tout en assurant une collecte d'informations pertinentes pour les applications visées. Ces caméras sont déjà existantes et sont composées d'un capteur basse résolution, d'un capteur analogique PIR, d'un petit FPGA (Max10 – Low cost et low power) et d'un ESP32-C6 pour la gestion de la communication en réseau via Bluetooth.
Problématique
L'utilisation de caméras sans fil dans un environnement dynamique impose des exigences contradictoires. D'une part, il est nécessaire de capturer et d'analyser des données pour garantir une précision optimale. D'autre part, il faut minimiser la consommation énergétique et la latence de transmission. L'architecture matérielle existante, reposant sur un petit FPGA (Max10) et un ESP32 pour la communication en Bluetooth, impose des contraintes fortes en termes d'optimisation des traitements embarqués et d'efficacité du protocole d'échange.
Face à ces contraintes, nous proposons une approche unifiée et originale : chaque noeud du réseau intègre un auto encodeur dont l'espace latent remplit une double fonction. D'une part, il sert de représentation compressée de l'information visuelle, réduisant considérablement la quantité de données à transmettre sur le réseau Bluetooth. D'autre part, chaque vecteur latent horodaté constitue une entrée du registre distribué, répliqué sur l'ensemble des noeuds, permettant de reconstituer l'historique des observations en interrogeant n'importe quel noeud du réseau. L'IA fédérative intervient alors pour aligner les espaces latents entre les différents noeuds, garantissant l'interopérabilité des représentations sans nécessiter de centralisation des données brutes.
Objectifs de la recherche
L'objectif principal est de concevoir une architecture unifiée où l'auto encodeur embarqué sur chaque noeud est la pierre angulaire : il assure à lui seul la compression de l'information, la préservation de la confidentialité (les latents ne sont pas interprétables visuellement) et l'alimentation du registre distribué.
Cet objectif se décline en quatre axes : concevoir des auto encodeurs quantifiés (8 bits ou moins) capables de tourner sur un FPGA Max10 en optimisant le compromis taille du latent / qualité de reconstruction / ressources matérielles ; construire un registre distribué où chaque bloc est un latent horodaté, chaîné cryptographiquement et répliqué sur tous les noeuds, avec un consensus potentiellement hybride (crypto + cohérence sémantique) ; mettre en oeuvre un apprentissage fédéré qui aligne les espaces latents entre noeuds pour garantir leur interopérabilité sans jamais échanger d'images brutes ; et optimiser le protocole Bluetooth pour l'échange des latents et des paramètres fédérés sous contraintes de bande passante et d'énergie.
Approche méthodologique
La méthodologie s'appuie sur une approche hybride combinant théorie, simulation et expérimentation sur le matériel existant, organisée en quatre phases. La première est consacrée à la conception et l'implémentation sur FPGA Max10 d'auto encodeurs quantifiés (8 bits, 4 bits, binaire) pour les images 32×32, en explorant des architectures efficientes et en évaluant le compromis taille du latent / qualité de reconstruction / ressources matérielles. La deuxième phase porte sur le registre distribué : chaînage cryptographique des latents, protocole de réplication Bluetooth, gestion des contraintes mémoire de l'ESP32, mécanismes d'élagage de l'historique et formalisation du consensus hybride crypto-sémantique. La troisième phase est dédiée à l'apprentissage fédéré pour l'alignement inter-noeuds des auto encodeurs, avec l'évaluation de stratégies d'agrégation adaptées aux contraintes du réseau et l'étude de la dérive des espaces latents due aux conditions hétérogènes entre capteurs. La quatrième phase consiste en l'intégration sur un prototype réel suivie d'une évaluation globale portant sur la consommation énergétique, la latence, la précision IA, la qualité de reconstruction depuis les latents et l'intégrité du registre distribué.
Impact et contributions attendues
La contribution principale réside dans la proposition d'une architecture unifiée où l'espace latent de l'auto encodeur sert de support natif au registre distribué, fusionnant en une seule opération la compression, la protection de la vie privée et la traçabilité des données, ce qui est particulièrement adapté aux noeuds ultra-contraints où chaque opération doit servir plusieurs objectifs. La thèse contribuera également à repousser les limites de l'apprentissage fédéré sur des FPGA low-cost et des microcontrôleurs, un terrain encore peu exploré puisque la littérature se concentre sur des noeuds plus puissants comme les smartphones ou les serveurs « edge », avec des apports sur la quantification des modèles et l'alignement d'espaces latents hétérogènes. Le mécanisme de registre distribué conçu sur mesure, avec son consensus hybride cryptographique et sémantique, ouvrira des pistes transposables à d'autres réseaux de capteurs IoT confrontés aux mêmes limitations. Enfin, la confidentialité est assurée à trois niveaux complémentaires — basse résolution des capteurs, échange exclusif de latents non interprétables visuellement, et absence de centralisation des données brutes grâce au fédéré — ce qui constitue une approche de « privacy by design » multicouche cohérente, ouvrant la voie à des applications variées allant de la surveillance à la reconnaissance d'objets autonomes dans un contexte de frugalité.
Conclusion
L'originalité de cette thèse réside dans l'intégration profonde entre auto encodeur embarqué, registre distribué et apprentissage fédéré au sein d'un réseau de caméras sans fil à ressources ultra-contraintes. En faisant de l'espace latent le vecteur à la fois de la compression, de la confidentialité et de la traçabilité distribuée, cette architecture propose une solution cohérente et frugale aux défis posés par les réseaux de capteurs visuels intelligents. L'utilisation de caméras de très basse résolution, couplée à l'apprentissage collaboratif décentralisé, permettra de concilier performance, respect de la vie privée et sobriété énergétique, tout en ouvrant de nouvelles perspectives pour les technologies embarquées.
Starting date
Funding category
Funding further details
Presentation of host institution and host laboratory
L'Institut Pascal, UMR 6602, est une unité mixte de recherche et de formation interdisciplinaire de 400 personnes placée sous la tutelle de l'Université Clermont Auvergne (UCA) et du CNRS. Le CHU de Clermont-Ferrand est tutelle secondaire de l'unité. L'Institut Pascal est membre de Clermont Auvergne INP, qui regroupe trois écoles d'ingénieurs ISIMA, POLYTECH Clermont et SIGMA Clermont.
L'Institut Pascal est né de la fusion successive (2012, 2017, 2021) à vocation structurante de sept laboratoires couvrant les disciplines des Sciences de l'Ingénierie et des Systèmes du site clermontois : Génie des Procédés, Mécanique, Robotique, Physique des Sciences de l'Information, Santé.
Le laboratoire développe des connaissances et des technologies contribuant à trois domaines d'application : l'usine (incluant les écosystèmes), les transports et l'hôpital du futur.
L'Institut Pascal est membre de FACTOLAB, laboratoire commun avec MICHELIN. Il est porteur du laboratoire d’excellence IMobS3 et membre du réseau CNRS EquipEx ROBOTEX et des LabEx GaNeX (PIA1) et PRIMES. L'unité est membre du pôle de compétitivité CIMES, et des pôles AXELERA, MINALOGIC, POLYMERIS, XYLOFUTUR par un partenariat de l'UCA. L'Institut Pascal est membre de l'Institut Carnot MECD.
L'unité est structurée en cinq Axes de recherche :
• Génie des Procédés, Energétique et Biosystèmes (GePEB)
• Image, Systèmes de Perception, Robotique (ISPR)
• Mécanique, Génie Mécanique, Génie Civil, Génie Industriel (M3G)
• Photonique, Ondes, Nanomatériaux (PHOTON)
• Thérapies Guidées par l’Image (TGI)
Les forces vives de l'Institut Pascal sont localisées sur le site clermontois (Campus des Cézeaux : direction/EUPI, Polytech, SIGMA. CHU : G. Montpied et Estaing), le site de Montluçon (IUT d'Allier) et le site du Puy en Velay (IUT de Clermont).
PhD title
Country where you obtained your PhD
Institution awarding doctoral degree
Graduate school
Candidate's profile
Le candidat idéal est titulaire d'un diplôme de Master (ou équivalent) en informatique, électronique, traitement du signal ou génie des systèmes embarqués, avec un intérêt marqué pour la recherche à l'interface entre intelligence artificielle et systèmes matériels contraints. Une expérience préalable dans le cadre d'un stage de recherche ou d'un projet académique ambitieux sera appréciée.
Sur le plan des compétences techniques, le candidat devra maîtriser ou avoir de solides bases dans les domaines suivants : l'apprentissage automatique et plus particulièrement les architectures de réseaux de neurones profonds (auto-encodeurs, réseaux convolutifs), la programmation en Python et l'utilisation de frameworks de deep learning tels que PyTorch ou TensorFlow, ainsi que des notions de quantification de modèles et d'optimisation pour l'inférence embarquée. Des connaissances en conception matérielle sur FPGA, notamment via des langages de description matérielle tels que VHDL ou Verilog, constitueront un atout significatif, de même qu'une familiarité avec les environnements de développement embarqué (C/C++ sur microcontrôleur, ESP32 en particulier). Une sensibilisation aux protocoles de communication sans fil, notamment Bluetooth Low Energy, ainsi qu'aux concepts fondamentaux de cryptographie et de systèmes distribués sera également bienvenue.
Au-delà des compétences techniques, le doctorant devra faire preuve d'autonomie, de rigueur scientifique et d'une réelle capacité à travailler en équipe au sein d'un environnement pluridisciplinaire impliquant des chercheurs en informatique, en électronique et en traitement d'images. De bonnes aptitudes rédactionnelles en français et en anglais sont indispensables, l'anglais étant la langue de référence pour les publications et communications scientifiques internationales. Enfin, une curiosité intellectuelle pour les enjeux sociétaux liés à la protection de la vie privée, à la sobriété numérique et à l'intelligence artificielle responsable sera considérée comme un atout dans le cadre de ce projet à forte dimension éthique et environnementale.
Vous avez déjà un compte ?
Nouvel utilisateur ?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
SUEZ
Servier
Laboratoire National de Métrologie et d'Essais - LNE
Ifremer
ANRT
Nantes Université
TotalEnergies
Groupe AFNOR - Association française de normalisation
ADEME
ONERA - The French Aerospace Lab
Institut Sup'biotech de Paris
Nokia Bell Labs France
Aérocentre, Pôle d'excellence régional
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Tecknowmetrix
Medicen Paris Region
Généthon


