Compression hybride de réseaux de neurones pour l’IA embarquée : concilier efficacité et performance // Hybrid Compression of Neural Networks for Embedded AI: Balancing Efficiency and Accuracy
ABG-133631 | Sujet de Thèse | |
01/10/2025 | Financement public/privé |
CEA Rennes Laboratoire Vision pour la Modélisation et la Localisation
Saclay
Compression hybride de réseaux de neurones pour l’IA embarquée : concilier efficacité et performance // Hybrid Compression of Neural Networks for Embedded AI: Balancing Efficiency and Accuracy
- Science de la donnée (stockage, sécurité, mesure, analyse)
Data intelligence dont Intelligence Artificielle / Défis technologiques
Description du sujet
Les réseaux de neurones convolutifs (CNNs) sont aujourd’hui au cœur de la vision par ordinateur, mais leur déploiement sur des systèmes embarqués (robots, objets connectés, dispositifs mobiles) reste limité par leur taille et leur consommation en énergie. Une solution consiste à compresser les modèles pour les rendre plus légers et plus rapides, sans perte importante de précision. Plusieurs approches existent (quantification des poids, factorisation bas-rang, sparsité), mais elles atteignent rapidement leurs limites lorsqu’elles sont appliquées séparément. L’objectif de cette thèse est de développer un cadre d’optimisation unifié permettant de combiner ces techniques de façon synergique. Le travail comportera une part théorique (modélisation mathématique, optimisation) et une part expérimentale (validation sur réseaux standards comme ResNet ou MobileNet, puis sur plateformes embarquées type Jetson, Raspberry Pi, FPGA). À plus long terme, l’approche pourra être testée sur d’autres architectures comme les transformers. Le projet s’appuie sur une collaboration entre un laboratoire académique spécialisé en décomposition tensorielle et un partenaire orienté hardware, offrant un encadrement complémentaire et interdisciplinaire.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Convolutional Neural Networks (CNNs) have become a cornerstone of computer vision, yet deploying them on embedded devices (robots, IoT systems, mobile hardware) remains challenging due to their large size and energy requirements. Model compression is a key solution to make these networks more efficient without severely impacting accuracy. Existing methods (such as weight quantization, low-rank factorization, and sparsity) show promising results but quickly reach their limits when used independently. This PhD will focus on designing a unified optimization framework that combines these techniques in a synergistic way. The work will involve both theoretical aspects (optimization methods, adaptive rank selection) and experimental validation (on benchmark CNNs like ResNet or MobileNet, and on embedded platforms such as Jetson, Raspberry Pi, and FPGA). An optional extension to transformer architectures will also be considered. The project benefits from complementary supervision: academic expertise in tensor decompositions and an industrial-oriented partner specialized in hardware-aware compression.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département Intelligence Ambiante et Systèmes Interactifs (LIST)
Service : Service Intelligence Artificielle pour le Langage et la Vision
Laboratoire : Laboratoire Vision pour la Modélisation et la Localisation
Date de début souhaitée : 01-12-2025
Ecole doctorale : MAthématiques, Télécommunications, Informatique, Signal, Systèmes, Électronique (MATISSE)
Directeur de thèse : CHILLET Daniel
Organisme : ENSSAT _ Université de Rennes 1
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Convolutional Neural Networks (CNNs) have become a cornerstone of computer vision, yet deploying them on embedded devices (robots, IoT systems, mobile hardware) remains challenging due to their large size and energy requirements. Model compression is a key solution to make these networks more efficient without severely impacting accuracy. Existing methods (such as weight quantization, low-rank factorization, and sparsity) show promising results but quickly reach their limits when used independently. This PhD will focus on designing a unified optimization framework that combines these techniques in a synergistic way. The work will involve both theoretical aspects (optimization methods, adaptive rank selection) and experimental validation (on benchmark CNNs like ResNet or MobileNet, and on embedded platforms such as Jetson, Raspberry Pi, and FPGA). An optional extension to transformer architectures will also be considered. The project benefits from complementary supervision: academic expertise in tensor decompositions and an industrial-oriented partner specialized in hardware-aware compression.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département Intelligence Ambiante et Systèmes Interactifs (LIST)
Service : Service Intelligence Artificielle pour le Langage et la Vision
Laboratoire : Laboratoire Vision pour la Modélisation et la Localisation
Date de début souhaitée : 01-12-2025
Ecole doctorale : MAthématiques, Télécommunications, Informatique, Signal, Systèmes, Électronique (MATISSE)
Directeur de thèse : CHILLET Daniel
Organisme : ENSSAT _ Université de Rennes 1
Nature du financement
Financement public/privé
Précisions sur le financement
Présentation établissement et labo d'accueil
CEA Rennes Laboratoire Vision pour la Modélisation et la Localisation
Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département Intelligence Ambiante et Systèmes Interactifs (LIST)
Service : Service Intelligence Artificielle pour le Langage et la Vision
Profil du candidat
Postuler
Fermer
Vous avez déjà un compte ?
Nouvel utilisateur ?
Besoin d'informations sur l'ABG ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
ANRT
TotalEnergies
Nokia Bell Labs France
Généthon
ONERA - The French Aerospace Lab
Aérocentre, Pôle d'excellence régional
MabDesign
SUEZ
CASDEN
Ifremer
Groupe AFNOR - Association française de normalisation
Laboratoire National de Métrologie et d'Essais - LNE
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
PhDOOC
MabDesign
Tecknowmetrix
CESI
ADEME
Institut Sup'biotech de Paris