Policy Adaptation over Environmental Configurations in Survivor Type Games

Markus Johannes Pedersen

dc.contributor.advisor	Ole Christian Eidheim
dc.contributor.advisor	Jonathan Jørgensen
dc.contributor.author	Markus Johannes Pedersen
dc.date.accessioned	2023-10-28T17:19:58Z
dc.date.available	2023-10-28T17:19:58Z
dc.date.issued	2023
dc.identifier	no.ntnu:inspera:145904930:35331123
dc.identifier.uri	https://hdl.handle.net/11250/3099258
dc.description.abstract	This thesis explores the applicability and effectiveness of direct policy transfer in reinforcement learning (RL), with a focus on environmental configurations within the open-source game openSURVIVORS. We investigate how policy transfer can decrease the time to threshold and enhance jumpstart and asymptotic performance across various environmental configurations. Our experimental results highlight the strong influence of the game's unique environmental dynamics on policy effectiveness and transferability, with different RL agents exhibiting varied performance based on their respective training environments. While the asymptotic performance of agents trained via policy transfer remains inconclusive due to non-convergence within the study's scope, our findings demonstrate that policy transfer outperforms training from scratch, indicating its potential advantages in learning new environments. This research advances the understanding of policy transfer in RL, offering insights into training agents more effectively across diverse environments.
dc.description.abstract	Denne oppgaven utforsker effektiviteten til direkte overføring av evenene til i reinforcement learning agent, med fokus på problems konfigurasjoner innenfor det åpne kildekode-spillet openSURVIVORS. Vi undersøker hvordan overføring av agentenes evner kan redusere trenings tiden på tvers av ulike problem konfigurasjoner. Våre eksperimentelle resultater fremhever den sterke påvirkningen av spillets dynamikk på evnene til agentene på tvers av problemkonfigurasjoner. RL-agentene viser varierende ytelse basert på deres respektive treningsmiljøer. Våre funn viser at at overføring av evner over konfigurasjoner presterer bedre enn trening fra bunnen av, noe som indikerer potensielle fordeler ved denne metoden. Denne forskningen bidrar til å øke forståelsen av overføring av evner i RL og gir innsikt i mer effektiv trening av agenter på tvers av ulike miljøer.
dc.language	eng
dc.publisher	NTNU
dc.title	Policy Adaptation over Environmental Configurations in Survivor Type Games
dc.type	Master thesis

Tilhørende fil(er)

Filnavn:: no.ntnu:inspera:145904930:3533 ...
Størrelse:: 2.415Mb
Format:: PDF

Åpne

Denne innførselen finnes i følgende samling(er)

Institutt for datateknologi og informatikk [6772]

Vis enkel innførsel