零基础机器学习做游戏辅助第九课--强化学习DQN(一)

一、强化学习简介

强化学习(英语:Reinforcement learning,简称RL)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。强化学习是除了监督学习和非监督学习之外的第三种基本的机器学习方法。与监督学习不同的是,强化学习不需要带标签的输入输出对,同时也无需对非最优解的精确地纠正。其关注点在于寻找探索(对未知领域的)和利用(对已有知识的)的平衡,强化学习中的“探索-利用”的交换,在多臂老虎机问题和有限MDP中研究得最多。

强化学习是比监督学习更优秀的一种机器学习方法,监督学习需要有数据和对应的正确标签来进行训练,强化学习前期并没有数据和标签,它需要在环境中不断尝试,发现规律然后得到更高的奖励。

二、认识Q-learning算法

Q-learning是我们学习强化学习的一个基础算法。在此基础上我们再去延伸。

行为选择

你可能感兴趣的:(零基础机器学习做游戏辅助,人工智能做游戏辅助,深度神经网络,强化学习做游戏辅助,神经网络做游戏辅助)