MODÉLISATION DE L'ACTION JOINTE AVEC APPRENTISSAGE PAR RENFORCEMENT POUR LA VARIABILITÉ INTER- ET INTRA- PERSONNELLE // MODELING JOINT ACTION REINFORCEMENT LEARNING UNDER INTER- AND INTRA- PERSONAL VARIABILITY
|
ABG-136712
ADUM-72133 |
Sujet de Thèse | |
| 14/03/2026 | Contrat doctoral |
Université de Lorraine
Vandoeuvre lès Nancy cedex - Grand Est - France
MODÉLISATION DE L'ACTION JOINTE AVEC APPRENTISSAGE PAR RENFORCEMENT POUR LA VARIABILITÉ INTER- ET INTRA- PERSONNELLE // MODELING JOINT ACTION REINFORCEMENT LEARNING UNDER INTER- AND INTRA- PERSONAL VARIABILITY
Humain-Robot, Robotique Neuronale, Action Jointe, Attention Jointe, Modéliation Bio inspirée, Cognition Sociale
Human-robot interaction, Neural robotics, Joint Attention, Joint Action, Bio-inspired modeling, Social cognition
Human-robot interaction, Neural robotics, Joint Attention, Joint Action, Bio-inspired modeling, Social cognition
Description du sujet
Bien que des recherches récentes en robotique sociale se soient intéressées au fait de doter un robot de la capacité à trouver un
équilibre entre des mouvements expressifs et des mouvements fonctionnels (visant uniquement à résoudre une tâche) dans les tâches
d'actions jointes, en utilisant notamment l'apprentissage par renforcement (voir, par exemple, Hu et al., 2025), ces travaux ne
concernent pas l'adaptabilité du robot à la situation d'interaction.
L'approche adoptée consiste généralement à doter le robot d'un répertoire de comportements prédéfinis, comportements qui ne sont
peut-être pas toujours adaptés si l'on tient compte des différences entre les différents sujets humains (inter-variabilité). De plus, les
approches ne considèrent pas non plus la variabilité pour un même sujet (intra-variabilité), au sens où les motivations, les envies,
l'attention d'un sujet varient au cours du temps. De notre point de vue, ces approches n'abordent pas toute la complexité de la question
de l'interaction jointe en robotitque sociale.
Ainsi, l'originalité du travail de thèse que nous proposons consiste à étudier la co-adaptation humain-
robot 'en-ligne' dans l'interaction expressive. Nous aimerions explorer l'utilisation du cadre général de l'apprentissage par renforcement
(Sutton et Barto, 1998) pour modéliser le problème de l'adaptation comme un processus d'optimisation stochastique, prenant ainsi en
compte la variabilité inter- et intra-sujet pour les scénarii d'interaction d'action conjointe.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Although recent studies in social robotics have addressed the problem of providing the robot with the ability to balance between motion
expressiveness and function in achieving joint tasks (e.g. in Hu et al., 2025) using, for example, reinforcement learning, they do not
consider the adaptability of the robot to the situation. The approach adopted consists in endorsing the robot with a predefined behavior
repertory, with may not be suitable when considering human inter-variability. Also, the approach does not consider intra-subject
variability, in the sense that humans continuously fluctuate in mood, awareness, and motivation; which results in our opinion in a
somewhat narrow perspective for social robotics in joint action interaction with humans.
Therefore, the originality of the thesis work we propose consists in investigating online human-robot
co-adaptation in expressive interaction. We would like to explore using the general framework of Reinforcement Learning (Sutton and
Barto, 1998) to model the adaptation problem as a stochastic optimization process, thus taking into account both inter- and intra-subject
variability for joint action interaction scenarios.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
équilibre entre des mouvements expressifs et des mouvements fonctionnels (visant uniquement à résoudre une tâche) dans les tâches
d'actions jointes, en utilisant notamment l'apprentissage par renforcement (voir, par exemple, Hu et al., 2025), ces travaux ne
concernent pas l'adaptabilité du robot à la situation d'interaction.
L'approche adoptée consiste généralement à doter le robot d'un répertoire de comportements prédéfinis, comportements qui ne sont
peut-être pas toujours adaptés si l'on tient compte des différences entre les différents sujets humains (inter-variabilité). De plus, les
approches ne considèrent pas non plus la variabilité pour un même sujet (intra-variabilité), au sens où les motivations, les envies,
l'attention d'un sujet varient au cours du temps. De notre point de vue, ces approches n'abordent pas toute la complexité de la question
de l'interaction jointe en robotitque sociale.
Ainsi, l'originalité du travail de thèse que nous proposons consiste à étudier la co-adaptation humain-
robot 'en-ligne' dans l'interaction expressive. Nous aimerions explorer l'utilisation du cadre général de l'apprentissage par renforcement
(Sutton et Barto, 1998) pour modéliser le problème de l'adaptation comme un processus d'optimisation stochastique, prenant ainsi en
compte la variabilité inter- et intra-sujet pour les scénarii d'interaction d'action conjointe.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Although recent studies in social robotics have addressed the problem of providing the robot with the ability to balance between motion
expressiveness and function in achieving joint tasks (e.g. in Hu et al., 2025) using, for example, reinforcement learning, they do not
consider the adaptability of the robot to the situation. The approach adopted consists in endorsing the robot with a predefined behavior
repertory, with may not be suitable when considering human inter-variability. Also, the approach does not consider intra-subject
variability, in the sense that humans continuously fluctuate in mood, awareness, and motivation; which results in our opinion in a
somewhat narrow perspective for social robotics in joint action interaction with humans.
Therefore, the originality of the thesis work we propose consists in investigating online human-robot
co-adaptation in expressive interaction. We would like to explore using the general framework of Reinforcement Learning (Sutton and
Barto, 1998) to model the adaptation problem as a stochastic optimization process, thus taking into account both inter- and intra-subject
variability for joint action interaction scenarios.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2026
Nature du financement
Contrat doctoral
Précisions sur le financement
Concours pour un contrat doctoral
Présentation établissement et labo d'accueil
Université de Lorraine
Etablissement délivrant le doctorat
Université de Lorraine
Ecole doctorale
77 IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES
Profil du candidat
-- Avoir obtenu un diplôme équivalent à un Master 2 français en robotique ou informatique ou mathématique appliquées ou sciences
cognitives.
-- Un intérêt marqué pour la recherche en interaction humain-robot, 'embodiment', sciences cognitives et la modélisation bio-inspirée.
-- Savoir programmer en Python, (savoir programmer en C++ est un plus appréciable).
-- Des notions de modélisation géométrique et du contrôle de comportements robotique seraient un plus.
-- Niveau en français ou anglais requis : un niveau moyen, au minimum. Vous devez pouvoir commprendre, et vous exprimer
correctement et de manière cohérente sur les sujets qui vous sont familiers.
• Equivalent degree to a French Master II diploma in robotics, computer science, mathematical modeling or cognitive science. • Deep research interest in human-robot interaction, embodiment, cognitive sciences and bio-inspired modeling. • Programming skills in Python language (skills in C++ would be a plus). • Notions of classical geometric modeling and behavior regulation in robotics would be a plus. • Level of French or English required: at least intermediate level. You can speak the language understandably, coherently and confidently on everyday topics that are familiar to you.
• Equivalent degree to a French Master II diploma in robotics, computer science, mathematical modeling or cognitive science. • Deep research interest in human-robot interaction, embodiment, cognitive sciences and bio-inspired modeling. • Programming skills in Python language (skills in C++ would be a plus). • Notions of classical geometric modeling and behavior regulation in robotics would be a plus. • Level of French or English required: at least intermediate level. You can speak the language understandably, coherently and confidently on everyday topics that are familiar to you.
01/05/2026
Postuler
Fermer
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
Ifremer
TotalEnergies
Aérocentre, Pôle d'excellence régional
Institut Sup'biotech de Paris
Servier
ONERA - The French Aerospace Lab
SUEZ
Medicen Paris Region
ANRT
Groupe AFNOR - Association française de normalisation
Laboratoire National de Métrologie et d'Essais - LNE
Généthon
Tecknowmetrix
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Nantes Université
Nokia Bell Labs France
ADEME
-
EmploiRef. 136129Nouméa , Territoires d'Outre-Mer , France
IFREMERResponsable Scientifique d'Unité Responsable de la Délégation de la Nouvelle Calédonie H/F
Expertises scientifiques :Ecologie, environnement
Niveau d’expérience :Niveau d'expérience indifférent
-
EmploiRef. 136697Paris , Ile-de-France , France
Association Bernard Gregory ABGAnimateur.rice / Formateur.rice
Expertises scientifiques :Indifférent
Niveau d’expérience :Niveau d'expérience indifférent
