Differentiable decision trees for reinforcement learning
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3042816Utgivelsesdato
2022Metadata
Vis full innførselSamlinger
Beskrivelse
Full text not available
Sammendrag
Forsterkende læring (engelsk: Reinforcement learning) bruker ofte dype nett til å beregne oppførsel i et miljø. Dype nett er en type maskinlæringsmodell som er svært vanskelig for mennesker og tolke, og blir derfor ofte referert som en "svart-boks" modell. Det er derfor vanskelig å finne ut hva som vektlegges og hvordan beslutninger tas. Likevel brukes dype nett ettersom de gir betydelig bedre resultater enn tilgjengelige metoder uten dype nett.
Det er nylig utviklet forsterkende lærings modeller som erstatter disse dype nettene med en annen maskinlæringsmodell, differensielle beslutningstrær. Denne typen modell er mye mer intuitiv og lettere å forstå. Foreløpig er det ikke gjort mye testing av denne typen modeller utenom noen basis miljø fra ressursen openAI. Det er derfor ønskelig å vurdere om denne typen modell kan brukes i forsterkende læring også i andre miljø.
Denne masteroppgaven begynner med å beskrive teori som er sentralt for forsterkende læring med både dype nett og differensielle beslutningstrær. Dette vil brukes til å implementere de forskjellige forsterkende lærings modellene. Modellene vil deretter testes i et optimaliserings miljø hvor en bil følger en vei. Resultatene fra testene vil evalueres og det vil konkluderes om denne typen forsterkende læring også kan brukes i mer komplekse optimaliseringsmiljø.