Blar i NTNU Open på forfatter "Frekhaug, Thomas Aleksander"
-
Safe Reinforcement Learning using Model Predictive Control: An analysis of utilising anisotropic exploration with deterministic policy gradients
Frekhaug, Thomas Aleksander (Master thesis, 2020)Denne avhandlingen er en studie i Trygg Forsterkende Læring (eng: Reinforcement Learning, RL) der det blir benyttet utforskningsagenter (eng: policy) som bruker anisotropisk utforskning. Trygg RL er en ny kategori av RL ...