Où docteurs et entreprises se rencontrent
Menu
Connexion

Techniques Avancées d’IA pour l’Extraction de Scénarios de Conduite en Milieu Urbain : IA Générative, meta-learning, Détection d’Objets et Augmentation de Données par Sim

ABG-132782 Sujet de Thèse
04/07/2025 Contrat doctoral
Logo de
Ecole Supérieure des Techniques Aéronautique et de la Construction Automobile (ESTACA)
Montigny le Bretonneux - Ile-de-France - France
Techniques Avancées d’IA pour l’Extraction de Scénarios de Conduite en Milieu Urbain : IA Générative, meta-learning, Détection d’Objets et Augmentation de Données par Sim
  • Sciences de l’ingénieur
Scénarios de conduite, Données urbaines, Intelligence artificielle, Méta-learning, Classification multilabel, Simulation de données, Série temporelle, Tokenisation, Transformers, Incertitude, ADAS, Véhicule autonome, Apprentissage frugal, Représentation latente, One-stage detection

Description du sujet

CONTEXTE DE LA THESE :
Cette thèse s’inscrit dans le cadre d’une collaboration entre l’Institut VEDECOM et l’ESTACA, dans le contexte du projet MOOVE Urban (Monitoring Outillé du Véhicule autonome dans son Environnement Urbain), soutenu par l’ANR ainsi que les industriels Renault et Stellantis.
La certification des systèmes avancés d’aide à la conduite (ADAS) repose principalement sur des essais basés sur des scénarios de conduite. Identifier de manière exhaustive l’ensemble des situations routières possibles et en apprendre la distribution statistique constitue un enjeu fondamental, mais extrêmement complexe [1]. Traditionnellement, l’extraction de scénarios à partir des données de roulage repose principalement sur des approches déterministes basées sur des règles expertes, qui présentent une forte transparence mais souffrent d’une rigidité limitant leur capacité à capturer la diversité, la complexité et l’imprévisibilité notamment l’environnements urbains. En particulier, ces méthodes montrent leurs limites face à la détection des scénarios rares, inconnus ou extrêmes, essentiels à la sécurité des véhicules autonomes [2].
Face à ces défis, l'intégration des techniques d’intelligence artificielle (IA) apparaît incontournable. Le projet antérieur MOOVE 4.0, sur la base d’une base de données de roulage de plus d’un million de kilomètres, a permis de développer des outils IA efficaces pour l’analyse de scénarios sur voies à chaussées séparées (VCS) [3,4,5]. Cependant, l'environnement urbain présente des défis considérablement accrus : grande variabilité du trafic, interactions multiples et complexes entre des usagers hétérogènes (véhicules, piétons, cyclistes, etc.), diversité accrue des infrastructures urbaines et faible quantité de données annotées disponibles pour l’apprentissage, particulièrement concernant les scénarios rares ou dangereux [6]
Dans ce contexte, le projet MOOVE Urban ambitionne non seulement d'étendre les outils existants, mais aussi d'explorer de nouvelles approches IA adaptées à ces spécificités urbaines. Afin de compenser le manque de données annotées, la thèse explorera notamment des méthodes avancées d’augmentation des données à travers la simulation réaliste de scénarios critiques et rares. Par ailleurs, de nouvelles représentations des données, telles que la tokenisation des séries temporelles multivariées (combinant signaux continus et discrets), seront investiguées pour optimiser la gestion de la complexité structurelle et temporelle des scénarios urbains. Enfin, l'utilisation d'approches de meta-learning sera envisagée afin d'adapter rapidement les modèles aux scénarios rares ou inconnus, en les rendant également capables d’estimer et de gérer explicitement l’incertitude de leurs prédictions. Ces modèles seront ainsi conçus pour détecter lorsqu’un scénario est out-of-distribution (OOD), permettant au modèle d'être conscient de ses propres limites (savoir ce qu'il ne sait pas) [7]

OBJECTIFS DE LA THESE :

Unification des données : Concevoir une représentation tensorielle étendue capable d’englober simultanément les signaux continus et discrets, tout en préservant la configuration spatiale propre aux scénarios urbains. Cette structure doit notamment intégrer la complexité de l’infrastructure urbaine et la présence d’usagers vulnérables afin d’offrir un format d’entrée stable et complet et exploitable par les modèles d’intelligence artificielle.

Apprentissage frugal par Meta-Learning : Développer des méthodes d’apprentissage few-shot issues du méta-learning pour permettre aux modèles de s’adapter efficacement à de nouveaux scénarios urbains peu représentés ou totalement inédits, malgré la rareté des annotations disponibles. L’objectif est de renforcer la généralisation des modèles dans des contextes urbains variés et imprévus.

Classification multilabel des manoeuvres co-occurrantes : Concevoir un modèle de classification multilabel capable d’identifier simultanément plusieurs manoeuvres co-occurrentes dans une même séquence temporelle. Le modèle s’appuiera sur des mécanismes d’attention et un partitionnement spatio-temporel adapté pour capturer la complexité dynamique des interactions urbaines.

Augmentation par simulation et analyse en espace latent: Mettre en oeuvre une boucle fermée « extraction → projection latente → analyse → simulation » : les scénarios détectés sont projetés dans l’espace latent d’un modèle génératif, où l’analyse des zones sous-représentées permet d’identifier les lacunes du jeu de données. À partir de ces “trous” dans l’espace latent, les variables d’entrée pertinentes sont déduites pour générer de nouveaux scénarios via simulation réaliste.

Détection « one-stage » à faible latence : Remplacer le pipeline bi-étape actuel (fenêtrage + Non-Maximum Suppression) par une architecture légère, directe et efficace inspirée des paradigmes « one-stage » tels que YOLO, Faster R-CNN, CLIP, ALIGN ou Florence, adaptée aux séries temporelles longues. Cette nouvelle architecture devra permettre une détection rapide, précise et robuste des scénarios complexes en un seul passage.

Tokenisation des séries temporelles & backbones Transformer : Explorer une représentation tokenisée de séries temporelles, découpées en patchs temporels fusionnant les signaux continus et discrets, afin de tirer parti des architectures de type Transformer. Un pré-entraînement auto-supervisé sur un corpus massif de scénarios VCS non annotés sera envisagé, suivi d’un transfert vers le domaine urbain via un apprentissage few-shot.

Quantification et maîtrise de l’incertitude : Intégrer des approches probabilistes, telles que les deep ensembles ou l’inférence variationnelle, pour estimer la confiance des prédictions. L’objectif est de fournir une évaluation fiable de l’incertitude, réduisant le taux de faux positifs et de faux négatifs, et apportant des garanties supplémentaires dans les processus de validation des systèmes AD/ADAS.

 

Prise de fonction :

01/10/2025

Nature du financement

Contrat doctoral

Précisions sur le financement

Présentation établissement et labo d'accueil

Ecole Supérieure des Techniques Aéronautique et de la Construction Automobile (ESTACA)

L’Institut pour la Transition Energétique (ITE) VEDECOM est un institut français de recherche et de formation dédié aux mobilités innovantes et durables, à travers trois axes de R&D multidisciplinaire : l’électrification, le véhicule automatisé et connecté, les nouvelles solutions de mobilité et d’énergies partagées. Intégré dans le programme d'innovation "France 2030", l’Institut contribue également activement à de nombreux projets de recherche européens. Constitué de chercheurs, d'ingénieurs, de responsables d’études, de doctorants, ..., VEDECOM compte 80 collaborateurs qui ont à coeur de répondre aux problématiques de mobilité de demain.

L'ESTACA est une Ecole d’Ingénieurs spécialisée dans les transports (aéronautique, automobile, espace, transports guidés et naval). Ses équipes de recherche sont regroupées au sein d’ESTACA’LAB en deux Pôles : S2ET (« Systèmes et Energies Embarqués dans les Transports ») et MSCE (« Mécanique des Structures Composites et Environnement ») et sont réparties sur les 3 campus (Saint Quentin en Yvelines, Laval et Bordeaux). Le doctorant recruté sera intégré au pôle S2ET (« Systèmes et Energie Embarqués dans les Transports ») basé à Saint Quentin en Yvelines et à VEDECOM – Versailles.

Profil du candidat

Ingénieure ou titulaire d’un Master 2 en informatique, intelligence artificielle ou mathématiques
appliquées.

Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?