强化学习(RL)

强化学习-Reinforcement learning

参考:

1. 强化学习:基本概念 + 应用场景 + 主流算法

什么是强化学习?

强化学习并不是某一种特定的算法,而是一类算法的统称。如果用来做对比的话,他跟监督学习,无监督学习 是类似的,是一种统称的学习方式。

                                      强化学习(RL)_第1张图片

强化学习算法的思路非常简单,以游戏为例,如果在游戏中采取某种策略可以取得较高的得分,那么就进一步「强化」这种策略,以期继续取得较好的结果。这种策略与日常生活中的各种「绩效奖励」非常类似。我们平时也常常用这样的策略来提高自己的游戏水平。

强化学习和监督学习、无监督学习 最大的不同就是不需要大量的“数据喂养”,而是通过自己不停的尝试来学会某些技能。

入门:

  • 【强化学习】从强化学习基础概念开始(2019-6)

  • 强化学习如何入门?看这篇文章就够了

  • 强化学习通俗导论(一):什么是强化学习

  • 「教程」深度学习、强化学习进阶课程(YouTube视频,需要科学上网)

 

你可能感兴趣的:(人工智能,强化学习)