Blar i NTNU Open på forfatter "Münter, Rasmus A. Wichstrøm"
-
Propagating Variance in Reinforcement Learning Using Bayesian Regression
Münter, Rasmus A. Wichstrøm (Master thesis, 2019)I reinforcement learning kan bruk av bayesiske metoder føre til nesten optimale resultater på exploration-exploitation trade-off. For at disse metodene skal lykkes bør man ta hensyn til forholdet mellom forskjellige ...