A Modular Framework for Generic Imitation Learning using Graph-based Spatio-Temporal Representation of Demonstrations : application to Robotic Learning

L apprentissage par renforcement et l apprentissage par imitation permettent aux robots d apprendre à effectuer des tâches de manière autonome, sans avoir besoin d instructions explicites. Cette thèse examine les deux méthodes et les intègre dans un cadre modulaire et générique pour résoudre le prob...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : El Manyari Yassine (Auteur), Le Callet Patrick (Directeur de thèse), Dollé Laurent (Directeur de thèse), Filliat David (Président du jury de soutenance), Buffet Olivier Bernard Henri (Rapporteur de la thèse), Dutech Alain (Rapporteur de la thèse), Khamassi Mehdi (Membre du jury), Lamprier Sylvain (Membre du jury), Rossi Silvia (Membre du jury)
Collectivités auteurs : Nantes Université 2022-.... (Organisme de soutenance), École Doctorale Mathématiques et Sciences et Technologies du numérique, de l Information et de la Communication Nantes (Ecole doctorale associée à la thèse), Laboratoire des Sciences du Numérique de Nantes (Laboratoire associé à la thèse)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : A Modular Framework for Generic Imitation Learning using Graph-based Spatio-Temporal Representation of Demonstrations : application to Robotic Learning / Yassine El Manyari; sous la direction de Patrick Le Callet et de Laurent Dollé
Publié : 2023
Accès en ligne : Accès Nantes Université
Note sur l'URL : Accès au texte intégral
Note de thèse : Thèse de doctorat : Informatique appliquée : Nantes Université : 2023
Conditions d'accès : Thèse soumise à l'embargo de l'auteur jusqu'au 15 novembre 2023.
Sujets :
Description
Résumé : L apprentissage par renforcement et l apprentissage par imitation permettent aux robots d apprendre à effectuer des tâches de manière autonome, sans avoir besoin d instructions explicites. Cette thèse examine les deux méthodes et les intègre dans un cadre modulaire et générique pour résoudre le problème d apprentissage par imitation à partir d observations. L approche est mise en œuvre en deux étapes, en commençant par apprendre un modèle de représentation qui capture les caractéristiques spatiales et temporelles des démonstrations observées, suivi de l application d un algorithme RL prêt à l emploi avec une fonction de récompense générique pour apprendre la politique d imitation. Les résultats expérimentaux indiquent que la méthode proposée surpasse les méthodes de pointe et présente des capacités de généralisation prometteuses pour une gamme de tâches de manipulation, dépassant les méthodes génératives dans la plupart des cas.
Reinforcement Learning and Imitation Learning allow robots to learn how to perform tasks independently, without the need for explicit instructions. This thesis examines both methods and integrates them into a modular and generic framework for solving the imitation learning from observation problem. The approach is implemented in two stages, beginning with learning a representation model that captures the spatial and temporal features of observed demonstrations, followed by applying an off-the-shelf RL algorithm with a taskagnostic reward function to learn the imitation policy. Experimental results indicate that the proposed method outperforms state-of-the-art methods and exhibits promising generalisation capabilities across a range of manipulation tasks, surpassing generative methods in most instances.
Variantes de titre : Une approche modulaire pour l apprentissage par imitation générique à l aide d une représentation spatio-temporelle des démonstrations basée sur les graphes : application à l apprentissage robotique
Notes : Titre provenant de l'écran-titre
Ecole(s) Doctorale(s) : École Doctorale Mathématiques et Sciences et Technologies du numérique, de l Information et de la Communication (Nantes)
Partenaire(s) de recherche : Laboratoire des Sciences du Numérique de Nantes (Laboratoire)
Autre(s) contribution(s) : David Filliat (Président du jury) ; Mehdi Khamassi, Sylvain Lamprier, Silvia Rossi (Membre(s) du jury) ; Olivier Bernard Henri Buffet, Alain Dutech (Rapporteur(s))
Configuration requise : Configuration requise : un logiciel capable de lire un fichier au format : PDF