离线强化学习(Offline RL)系列5: (模型参数) 离线强化学习中的超参数选择(Offline Hyperparameters Selection)
论文信息:TomLePaine,CosminPaduraru,AndreaMichi,CaglarGulcehre,KonradZolna,AlexanderNovikov,ZiyuWang,NandodeFreitas:“HyperparameterSelectionforOfflineReinforcementLearning”,2020;arXiv:2007.09055.本文由DeepMin