Reinforcement Learning for Robotic Manipulation

Vagle, Anders Haver

Vagle, Anders Haver

Master thesis

URI

http://hdl.handle.net/11250/2625749

Date

2019

Metadata

Show full item record

Collections

Institutt for teknisk kybernetikk [3740]

Description

Full text not available

Abstract

Denne oppgaven tar for seg detaljer rundt implementasjon av PPO-algoritme for trening på egendefinerte miljøer designet for robotikk-basert manipulasjon. Resultatene er

lovende for de forenklede miljøene i simulering, men fungerer dårlig i den virkelige verden.

Simulering av ROS-implementerte roboter i Gazebo viser seg å være en treg prosess, og

sannsynligvis lite egnet for stor-skala operasjoner med mål om applikasjon i et virkelig

miljø.

This thesis present the implementation details of how the PPO algorithm was used to

train on custom environments designed for robotic manipulation. The results are promising in the simulated environments, but transfer to the real-world yields generally weak

performance. Simulation of ROS implemented robots in Gazebo proves to be a very slow

process, and likely not suitable for large-scale tasks with goals of real-world application.

Publisher

NTNU