【强化学习实战-05】Dueling DQN保姆级教程(1):以Cart Pole为例

【强化学习实战-05】Dueling DQN保姆级教程:以Cart Pole为例

  • Dueling DQN
  • Advantage function (优势函数)
  • Dueling Network
  • Dueling Network实战:
    • Dueling Network网络结构
    • Double DQN及其训练
    • 避免进入死循环
    • ϵ \epsilon ϵ-greedy
    • Expe

你可能感兴趣的:(RL+OR,机器学习+强化学习-笔记,深度学习,计算机视觉,神经网络)