dc.description.abstract | Medgjørlig robotmanipulering blir stadig viktigere innen robotstyring. For å utføre komplekse interaksjonsoppgaver i den virkelige verden, er det avgjørende. Automatisk ultralydundersøkelse utført av en robotarm er et eksempel på en slik oppgave, og krever meget tilpasningsdyktig styring. I denne oppgaven introduserer vi maskinlæringsteknikker i et utvalg lavnivå kraftkontrollere, med den intensjon å oppnå god interaksjonskontroll.
Den nyeste forskningen innen kontroll av robotinteraksjon er rettet mot oppnåelse av høy fleksibilitet og robusthet. Fremtredende tilnærminger faller ofte inn i kategorien Variabel Impedanskontroll (VIC), og oppnår fleksibilitet ved å justere dens dynamiske egenskaper underveis i utførelsen av en oppgave. Spesielt er det et økt fokus på læringsbasert VIC, hvor maskinlæringsteknikker brukes for å konstruere adaptive strategier. Imidlertid, for å oppnå god ytelse, krever disse metodene vanligvis mange interaksjoner under læring, noe som medfører høy slitasje på roboten. Målet med denne oppgaven er derfor å utvikle medgjørlige læringsbaserte interaksjonskontrollere som fungerer godt i utfordrende scenarier, ved hjelp av dataeffektive metoder. For dette formålet er modellbasert «Reinforcement Learning» av spesiell interesse. Ved å bruke modeller av systemet kan modellbaserte algoritmer forutsi tilstander og handlinger, og derved forbedre kontroll-strategier gjennom modellsimulering. Dette gjør læringsprosessen mer effektiv, noe som resulterer i færre fysiske interaksjoner.
I vår tilnærming implementeres og vurderes tre forskjellige kraftkontrollere i det effektive PILCO-rammeverket hvor Gaussiske Prosesser (GPs) benyttes for å innlemme modellusikkerhet i langsiktig planlegging. Kontrollerne representerer tre grunnleggende tilnærminger innen interaksjonskontroll: Admittance Control, Hybrid Force/Motion Control og Force-based VIC. Tilnærmingen blir evaluert gjennom robotinteraksjon med objekt-flater, hvor manipulatoren følger en bevegelsesbane mens den opprettholder en ønsket kontaktkraft. Basert på resultater fra simulering og eksperimentelle studier, blir kontrollerne analysert for deres styrker og svakheter i læringsrammeverket. Videre blir fordeler og ulemper ved GP-modellering undersøkt og diskutert sammen med anvisninger for fremtidig arbeid. | |
dc.description.abstract | The area of compliant robotic manipulation is one of increasing importance in the field of robotic control. For the performance of complex real world interaction tasks, requiring human-like skills of adaptability, it is fundamentally important. Robotic ultrasound examination on humans is an example of such a task, demanding highly adaptable force control. In this thesis, we introduce learning techniques in a selection of low-level force controllers, setting out to achieve force tracking behaviour in robotic interaction tasks.
Most recent research in the field of robotic interaction control is aimed at achieving high flexibility and robustness. Prominent approaches often fall into the category of Variable Impedance Control (VIC), achieving flexibility by adjusting its dynamical properties during the execution of a task. Especially, there is an increasing focus on learning-based VIC, utilizing Machine Learning techniques to construct adaptive strategies. However, to achieve good performance, these methods usually require a lot of interactions during learning, entailing high wear and tear of the robot. Thus, the aim of this thesis is to develop compliant learning-based controllers that perform well in challenging scenarios, utilizing efficient sampling methods. For this purpose, the field of model-based Reinforcement Learning is of particular interest. By utilizing models of the system, model-based algorithms can predict states and actions, thereby improving policies through model simulation. Consequently, making it more sampling efficient, requiring fewer physical interactions.
In our approach, three different force controllers are implemented and assessed in the state of the art, sampling efficient PILCO framework, using Gaussian Processes (GP's) to incorporate model uncertainty into long-term planning. The controllers represent three fundamental approaches in robotic interaction control: Admittance Control, Hybrid Force/Motion Control and Force-based VIC. The approach is evaluated in the use case of performing robotic interaction with object surfaces, where the manipulator executes a motion trajectory while maintaining a desired contact force. Based on results from simulation and experimental studies, the controllers are analysed for their limitations and benefits in the learning-framework. Furthermore, the pros and cons of GP-modelling are investigated, leading to a discussion on future directions. | |