Differentiable decision trees for reinforcement learning

Eik, Ruben

Eik, Ruben

Master thesis

Permanent lenke

https://hdl.handle.net/11250/3042816

Utgivelsesdato

2022

Metadata

Vis full innførsel

Samlinger

Institutt for teknisk kybernetikk [3715]

Beskrivelse

Full text not available

Sammendrag

Forsterkende læring (engelsk: Reinforcement learning) bruker ofte dype nett til å beregne oppførsel i et miljø. Dype nett er en type maskinlæringsmodell som er svært vanskelig for mennesker og tolke, og blir derfor ofte referert som en "svart-boks" modell. Det er derfor vanskelig å finne ut hva som vektlegges og hvordan beslutninger tas. Likevel brukes dype nett ettersom de gir betydelig bedre resultater enn tilgjengelige metoder uten dype nett.

Det er nylig utviklet forsterkende lærings modeller som erstatter disse dype nettene med en annen maskinlæringsmodell, differensielle beslutningstrær. Denne typen modell er mye mer intuitiv og lettere å forstå. Foreløpig er det ikke gjort mye testing av denne typen modeller utenom noen basis miljø fra ressursen openAI. Det er derfor ønskelig å vurdere om denne typen modell kan brukes i forsterkende læring også i andre miljø.

Denne masteroppgaven begynner med å beskrive teori som er sentralt for forsterkende læring med både dype nett og differensielle beslutningstrær. Dette vil brukes til å implementere de forskjellige forsterkende lærings modellene. Modellene vil deretter testes i et optimaliserings miljø hvor en bil følger en vei. Resultatene fra testene vil evalueres og det vil konkluderes om denne typen forsterkende læring også kan brukes i mer komplekse optimaliseringsmiljø.

Utgiver

NTNU