Où docteurs et entreprises se rencontrent
Menu
Connexion

Vous avez déjà un compte ?

Nouvel utilisateur ?

Multiagent deep reinforcement learning in mobile robotics

ABG-93398 Sujet de Thèse
22/09/2020 < 25 K€ brut annuel
ECE Paris-Lyon, Ecole d'Ingénieurs
Paris - Ile-de-France - France
Multiagent deep reinforcement learning in mobile robotics
  • Robotique
  • Informatique
  • Mathématiques
Multiagent Systems, Deep Reinforcement Learning

Description du sujet

Les humains (alias agents, dans la taxonomie de l'apprentissage automatique) sont dans une recherche constante d'une sorte de mécanisme automatique qui leur permettrait de prendre systématiquement de bonnes décisions pour un environnement donné. Dans cet environnement, il peut avoir des scénarios où il n'y a qu'un seul agent intelligent qui recherche de bonnes décisions ou, dans des scénarios plus complexes, plusieurs agents intelligents qui recherchent individuellement des décisions optimales pour l'intérêt de chacun. Dans le scénario des multi-agents, les agents peuvent partager un même objectif (le cas de tâches coopératives), un objectif opposé (le cas des tâches compétitives), ou un mélange des objectifs. La décision optimale prise par un agent peut différer selon si le problème considéré se compose d'un seul agent ou de plusieurs agents. Dans ce travail de thèse, nous nous intéressons à l'analyse rigoureuse de la différence des solutions trouvées à partir des scénarios allant d'un cas extrême où un agent intelligent n'a aucune connaissance des stratégies d'autres agents intelligents présents dans l'environnement à un autre cas extrême où cet agent intelligent a toute la connaissance des stratégies d'autres agents intelligents. En particulier, ce travail de thèse sera appliqué au domaine de plusieurs robots mobiles avec des objectifs mixtes (c'est-à-dire, certains d'entre eux sont coopératifs et d'autres sont compétitifs). L'approche adoptée dans ce travail doctoral sera les techniques de Multiagent Deep Reinforcement Learning (MDRL). Le problème abordé dans ce travail est facilement irréalisable avec les méthodes classiques de programmation dynamique. Par contre, l'apprentissage par renforcement est un bon candidat pour résoudre ce type de problèmes. En outre, la mise en œuvre d'algorithmes d'apprentissage par renforcement pour des systèmes multi-agents est une tâche complexe et, par conséquent, l’apprentissage par renforcement profond (alias Deep Reinforcement Learning) est souhaitable. De plus, le problème abordé dans ce travail de thèse est non stationnaire (dans le sens que la solution recherchée dépend des décisions prises par d'autres agents présents dans l'environnement) et partiellement observable (au sens où l'agent en question ne sait pas exactement quelles décisions les autres agents prendront).

 

En résumé, dans ce travail, le doctorant est censé de proposer un(des) algorithme(s) de multiagent deep reinforcement learning (l'apprentissage par renforcement profond dans des systèmes multi-agents) qui garantisse(nt) une convergence vers une fonction politique optimale (et adaptative) pour certaines bornes, dans un environnement robotique mobile avec des multi-agents, lequel est considéré comme non stationnaire et partiellement observable, dans le sens que d'autres agents intelligents (coopératifs et/ou compétitifs) prennent leurs propres décisions, lesquelles sont partiellement connues a priori par l'agent en question. Plus concrètement, cette thèse consistera de comparer la performance de plusieurs tâches en robotique mobile soit lorsqu'on connait les intentions des autres agents complètement ou partiellement, soit lorsqu'on ne les connait pas du tout . 

Prise de fonction :

04/01/2021

Nature du financement

Contrat doctoral

Précisions sur le financement

Présentation établissement et labo d'accueil

ECE Paris-Lyon, Ecole d'Ingénieurs

L’ECE (anciennement École Centrale d’Electronique) est une école d’ingénieurs privée généraliste dans les technologies du numérique accréditée par la CTI à délivrer un diplôme d'ingénieur depuis 1990. Elle est située dans le 15e arrondissement de Paris et dans le 7e arrondissement de Lyon.

L'ECE est une école du Pôle Ingénieurs d'INSEEC U. INSEEC U. est une institution privée d'enseignement supérieur et de recherche interdisciplinaire, implantée à Paris, Lyon, Bordeaux et Chambéry. Avec ses campus à Londres, Monaco Gèneve, San Francisco et Shanghai, INSEEC U. occupe une place unique dans le paysage éducatif français.

L'ECE est l'une des 205 écoles d'ingénieurs françaises accréditées à délivrer un diplôme d'ingénieur. Elle est membre de la Conférence des Grandes Écoles (CGE), de Campus France et de l'Union des Grandes Écoles Indépendantes.

Le cursus complet à l'ECE dure cinq ans à partir du baccalauréat : deux années de cycle préparatoire intégré puis trois années de cycle ingénieur.

Elle forme principalement des ingénieurs dans les technologies de l'information (systèmes d'information, télécoms, réseaux, IoT, systèmes embarqués, finance, multimédia). L'école a su diversifier ses enseignements en proposant de nouvelles formations axées sur la santé et son lien avec la technologie, sur les transports et la mobilité, ou bien sur les énergies et l'environnement.

Le Laboratoire de Recherche de l'ECE a trois axes de recherche: Mathématiques pour les Sciences de l'Ingénieur, Systèmes Intelligents Communicants et Nanosciences et Nanotechnologies pour la santé et l'énergie. 

Le Laboratoire articule ses activités de recherche autour de thématiques s’inscrivant dans les secteurs stratégiques de la santé, l’énergie, les transports, la finance, en lien avec les spécialités du cursus d’ingénieur de l’ECE, et à la confluence de plusieurs thématiques : systèmes intelligents, systèmes réseaux et temps réel, systèmes embarqués, systèmes nanométriques, modélisations mathématiques.

La thèse se fera au campus de l'ECE Paris. 

Intitulé du doctorat

Doctorat de Robotique

Pays d'obtention du doctorat

France

Etablissement délivrant le doctorat

Université Pierre et Marie Curie (UPMC)

Ecole doctorale

ED 391 - Sciences mécaniques, acoustiqu, électronique et robotique de Paris (SMAER)

Profil du candidat

Le (la) candidat(e) devra: 

  • avoir une bonne connaissance (théorique et pratique) de  Machine (Deep) Learning, la théorie de contrôle, l'algèbre linéaire, la probabilité, la programmation python, et la robotique,
  • être une personne responsable, ponctuelle, appliquée, sérieuse et sociable,
  • pouvoir bien travailler en groupe,
  • être autonôme au même temps.

Le(la) candidat(e) devra soumettre:

  • CV,
  • Notes scolaires (Cycle L, M1 et M2),
  • Lettre de motivation,
  • 2 lettres de recommandation,
  • Travaux précédents (par exemple: articles des journaux ou des conférences, brevets, rapports de stage, codes exemplaires, etc.)

 

Date limite de candidature

30/10/2020
Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?

Besoin d'informations ?

Vous souhaitez recevoir une ou plusieurs lettres d’information de l’ABG. Chaque mois des actualités, des offres, des outils, un agenda…

item1
Ils nous font confiance