Differentiable decision trees for reinforcement learning

Eik, Ruben

dc.contributor.advisor	Lekkas, Anastasios
dc.contributor.author	Eik, Ruben
dc.date.accessioned	2023-01-11T18:19:43Z
dc.date.available	2023-01-11T18:19:43Z
dc.date.issued	2022
dc.identifier	no.ntnu:inspera:102231297:22209086
dc.identifier.uri	https://hdl.handle.net/11250/3042816
dc.description	Full text not available
dc.description.abstract	Forsterkende læring (engelsk: Reinforcement learning) bruker ofte dype nett til å beregne oppførsel i et miljø. Dype nett er en type maskinlæringsmodell som er svært vanskelig for mennesker og tolke, og blir derfor ofte referert som en "svart-boks" modell. Det er derfor vanskelig å finne ut hva som vektlegges og hvordan beslutninger tas. Likevel brukes dype nett ettersom de gir betydelig bedre resultater enn tilgjengelige metoder uten dype nett. Det er nylig utviklet forsterkende lærings modeller som erstatter disse dype nettene med en annen maskinlæringsmodell, differensielle beslutningstrær. Denne typen modell er mye mer intuitiv og lettere å forstå. Foreløpig er det ikke gjort mye testing av denne typen modeller utenom noen basis miljø fra ressursen openAI. Det er derfor ønskelig å vurdere om denne typen modell kan brukes i forsterkende læring også i andre miljø. Denne masteroppgaven begynner med å beskrive teori som er sentralt for forsterkende læring med både dype nett og differensielle beslutningstrær. Dette vil brukes til å implementere de forskjellige forsterkende lærings modellene. Modellene vil deretter testes i et optimaliserings miljø hvor en bil følger en vei. Resultatene fra testene vil evalueres og det vil konkluderes om denne typen forsterkende læring også kan brukes i mer komplekse optimaliseringsmiljø.
dc.description.abstract
dc.language	eng
dc.publisher	NTNU
dc.title	Differentiable decision trees for reinforcement learning
dc.type	Master thesis

Files in this item

Files	Size	Format	View

This item appears in the following Collection(s)

Institutt for teknisk kybernetikk [3715]

Show simple item record