Blar i NTNU Open på forfatter "Wasaznik, Aleksander Gustaw"
-
Heuristics-based compartmentalization of Replay memory in simple environments
Wasaznik, Aleksander Gustaw (Master thesis, 2019)En viktig komponent av moderne forsterkningslæringsalgoritmer er repriseminnet. En rekke foreslåtte endringer i virkemåten til repriseminnet har blitt utforsket, men de fleste har med samplingsmekanismen å gjøre. Denne ...