Vous êtes*	↓ ↓
E-mail*	↓ ↓

Retourner à la recherche

Apprentissage par renforcement, méthode policy-gradient, pour la commande d’un robot marin de surface, soumis à des perturbations

Réf ABG-139400	Stage master 2 / Ingénieur	Durée 5 mois	Salaire net mensuel 640€ environ
02/06/2026

Bretagne INP

Lieu de travail

Plouzané (Brest) Bretagne France

Champs scientifiques

Robotique
Informatique

Mots clés

robotique, IA, apprentissage par renforcement, rétropropagation du gradient

Date limite de candidature

28/06/2026

Établissement recruteur

Site web :

https://bretagne-inp.fr/

Laboratoire de recherche:

LabSTICC-CNRS 6285 (https://labsticc.fr/fr ), équipe Rambo ,

plateforme CERV (https://cerv.enib.fr/ ) ,

Description

Lieu du stage : LabSTICC-CNRS 6285, plateforme CERV, Technopole Brest-Iroise

Dates : du 1^er septembre 2026 au 31 janvier 2027
Financement : LabSTICC/Thales-DMS, projet NeuroDyNav
Encadrants :
- Patrick Hénaff, Bretagne INP/ENIB, LabSTICC
- Olivier Chcron, Bretagne INP/ENIB, IRDL
- Ingénieur de Thales DMS, Brest

Objectif :

Le travail proposé pour ce stage s’insère dans un projet commun, entre le laboratoire LabSTICC et le centre Thales-DMS de Brest, sur le contrôle par intelligence artificielle d’un navire autonome de surface. L’objectif du stage concerne la mise en œuvre d’un contrôle par apprentissage en boucle fermée pour maintenir le navire à la même position de surface quelles que soient les perturbations (station-keeping), le navire disposant de nombreux capteurs permettant la mesure de la position du navire, les vitesses et directions des courants marins et du vent. La majeure partie des travaux seront menés en simulation, un test réel est envisagé selon la pertinence des résultats de simulation.

Un simulateur du navire sous Gazebo (Ros) existe déjà, les perturnations de sont pas encore implémentées.

Une première partie du stage consistera à appréhender le simulateur du navire sous Gazebo et l’algorithme d’apprentissage par renforcement (Pytorch) basé sur la rétropropagation du gradient adapté pour un apprentissage rapide en boucle fermée.

Une seconde partie, consistera à identifier différents scenarii de contrôle selon les perturbations possibles.

La dernière et principale partie du stage consistera à étudier et valider l’apprentissage de la commande du navire selon ces scenarii d’apprentissage. Les résultats produits par l’IA seront comparés aux résultats produits par les algorithmes de contrôle développés par l’équipe Thales-DMS.

Sur le plan organisationnel, le stage se déroulera au LabSTICC (bâtiment CERV de l’INP/ENIB) et des réunions régulières auront lieu entre les ingénieurs de Thales.

Méthodologie :

Les étapes à suivre pour mener à bien ce projet sont les suivantes :

Comprendre le simulateur du navire développé en 3D par le LabSTICC sous Gazebo.
Comprendre le modèle simulé de Thales-DMS sous Matlab -Simulink
Identifier différents scenarii de contrôle selon les perturbations possibles
Evaluer l’algorithme d’apprentissage de la commande du navire selon ces scenarii de perturbations
Comparaison des résultats de l’algorithme d’apprentissage et des lois de commande de Thales-DMS
Production des livrables (simulations répétables, code documenté)

Profil

Nationalité d’un pays membre de l’UE.
Master ou ingénieur en informatique et robotique avec des compétences en IA et si possible en robotique et simulation marine

Compétences :

programmation (python, C++), ROS,
simulation sous gazebo
commande, asservissement
Ouverture d’esprit, autonomie, qualité rédactionnelle
maîtrise de l’anglais,

Prise de fonction

01/09/2026

Partager via

Postuler

Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?

Civilité*	↓ ↓
Prénom*	↓ ↓
Nom*	↓ ↓
E-mail*	↓ ↓
Confirmez votre e-mail*	↓ ↓
Mot de passe*	8 caractères minimum, avec au moins un chiffre, une lettre minuscule et une lettre majuscule. ↓ ↓
Confirmez votre mot de passe*	↓ ↓