深度学习(四十)——深度强化学习(3)Deep Q-learning Network(2), DQN进化史
DeepQ-learningNetwork(续)NatureDQNDQN最早发表于NIPS2013,该版本的DQN,也被称为NIPSDQN。NIPSDQN除了提出DQN的基本概念之外,还使用了《机器学习(三十三)》中提到的ExperienceReplay技术。2015年初,Deepmind在Nature上提出了改进版本,是为NatureDQN。它改进了Loss函数:L=(r+γmaxa′Q(s′