Show simple item record

dc.contributor.advisorOle Christian Eidheim
dc.contributor.advisorJonathan Jørgensen
dc.contributor.authorMarkus Johannes Pedersen
dc.date.accessioned2023-10-28T17:19:58Z
dc.date.available2023-10-28T17:19:58Z
dc.date.issued2023
dc.identifierno.ntnu:inspera:145904930:35331123
dc.identifier.urihttps://hdl.handle.net/11250/3099258
dc.description.abstractThis thesis explores the applicability and effectiveness of direct policy transfer in reinforcement learning (RL), with a focus on environmental configurations within the open-source game openSURVIVORS. We investigate how policy transfer can decrease the time to threshold and enhance jumpstart and asymptotic performance across various environmental configurations. Our experimental results highlight the strong influence of the game's unique environmental dynamics on policy effectiveness and transferability, with different RL agents exhibiting varied performance based on their respective training environments. While the asymptotic performance of agents trained via policy transfer remains inconclusive due to non-convergence within the study's scope, our findings demonstrate that policy transfer outperforms training from scratch, indicating its potential advantages in learning new environments. This research advances the understanding of policy transfer in RL, offering insights into training agents more effectively across diverse environments.
dc.description.abstractDenne oppgaven utforsker effektiviteten til direkte overføring av evenene til i reinforcement learning agent, med fokus på problems konfigurasjoner innenfor det åpne kildekode-spillet openSURVIVORS. Vi undersøker hvordan overføring av agentenes evner kan redusere trenings tiden på tvers av ulike problem konfigurasjoner. Våre eksperimentelle resultater fremhever den sterke påvirkningen av spillets dynamikk på evnene til agentene på tvers av problemkonfigurasjoner. RL-agentene viser varierende ytelse basert på deres respektive treningsmiljøer. Våre funn viser at at overføring av evner over konfigurasjoner presterer bedre enn trening fra bunnen av, noe som indikerer potensielle fordeler ved denne metoden. Denne forskningen bidrar til å øke forståelsen av overføring av evner i RL og gir innsikt i mer effektiv trening av agenter på tvers av ulike miljøer.
dc.languageeng
dc.publisherNTNU
dc.titlePolicy Adaptation over Environmental Configurations in Survivor Type Games
dc.typeMaster thesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record