Show simple item record

dc.contributor.advisorLekkas, Anastasios
dc.contributor.authorEik, Ruben
dc.date.accessioned2023-01-11T18:19:43Z
dc.date.available2023-01-11T18:19:43Z
dc.date.issued2022
dc.identifierno.ntnu:inspera:102231297:22209086
dc.identifier.urihttps://hdl.handle.net/11250/3042816
dc.descriptionFull text not available
dc.description.abstractForsterkende læring (engelsk: Reinforcement learning) bruker ofte dype nett til å beregne oppførsel i et miljø. Dype nett er en type maskinlæringsmodell som er svært vanskelig for mennesker og tolke, og blir derfor ofte referert som en "svart-boks" modell. Det er derfor vanskelig å finne ut hva som vektlegges og hvordan beslutninger tas. Likevel brukes dype nett ettersom de gir betydelig bedre resultater enn tilgjengelige metoder uten dype nett. Det er nylig utviklet forsterkende lærings modeller som erstatter disse dype nettene med en annen maskinlæringsmodell, differensielle beslutningstrær. Denne typen modell er mye mer intuitiv og lettere å forstå. Foreløpig er det ikke gjort mye testing av denne typen modeller utenom noen basis miljø fra ressursen openAI. Det er derfor ønskelig å vurdere om denne typen modell kan brukes i forsterkende læring også i andre miljø. Denne masteroppgaven begynner med å beskrive teori som er sentralt for forsterkende læring med både dype nett og differensielle beslutningstrær. Dette vil brukes til å implementere de forskjellige forsterkende lærings modellene. Modellene vil deretter testes i et optimaliserings miljø hvor en bil følger en vei. Resultatene fra testene vil evalueres og det vil konkluderes om denne typen forsterkende læring også kan brukes i mer komplekse optimaliseringsmiljø.
dc.description.abstract
dc.languageeng
dc.publisherNTNU
dc.titleDifferentiable decision trees for reinforcement learning
dc.typeMaster thesis


Files in this item

FilesSizeFormatView

This item appears in the following Collection(s)

Show simple item record