【RL】--DQN、Double DQN、DQN-Prioritized Experience Replay、Dueling DQN
DQN介绍DQN算法是在Q-learning基础上的改进,在Q-learning中必须存在一张Q表。当时当环境变得极其复杂时,Q表的数据量会相当大,更新过程会变得异常复杂。在经过深度网络的学习之后,我们就可以利用神经网络来代替Q表,只需要把状态S和行动a作为输入就可以得到相应的输出Q(s,a)。算法原理DQN相比于Q-learning的改进之处在于上图中的两处神经网络NN-1和NN-2,两个网络结