Reinforcement Learning for Robotic Manipulation
Description
Full text not available
Abstract
Denne oppgaven tar for seg detaljer rundt implementasjon av PPO-algoritme for trening på egendefinerte miljøer designet for robotikk-basert manipulasjon. Resultatene erlovende for de forenklede miljøene i simulering, men fungerer dårlig i den virkelige verden.Simulering av ROS-implementerte roboter i Gazebo viser seg å være en treg prosess, ogsannsynligvis lite egnet for stor-skala operasjoner med mål om applikasjon i et virkeligmiljø. This thesis present the implementation details of how the PPO algorithm was used totrain on custom environments designed for robotic manipulation. The results are promising in the simulated environments, but transfer to the real-world yields generally weakperformance. Simulation of ROS implemented robots in Gazebo proves to be a very slowprocess, and likely not suitable for large-scale tasks with goals of real-world application.