浅尝深度强化学习(一)---Deep Q-Learning with Keras and Gym-CartPole-v0
1.前言1.1一直都觉得深度强化学习(DRLDeepeinReinforcementLearning)是一个很神奇的技术,利用奖励去(Reward)诱导神经网络(Neuralnetwork)学习参数,调整策略(Policy),使得智能体(Agent)做出适合当前局面(State)的动作(Action).1.2技术很神奇,但是学起来还是有些难度的,就上面这句话,就包含了深度强化学习的5个基本概念.D