DQN(Deep Q-learning)入门教程(结束)之总结

emm,花了一周时间完成了DQN的从入门到入土,这个系列是完完全全的入门系列,因为讲的内容很简单,内容也比较少,仅仅是一个最基本的介绍。

我也是因为偶然的原因才接触到强化学习,然后觉得很有意思,比较好奇它是怎么做到的,于是就花了一段时间去了解,接着就将自己的入门过程就写下来了。

这个系列相比较与数据挖掘系列的博客,内容还是比较少的,内容如下所示:

  1. DQN(Deep Q-learning)入门教程(零)之教程介绍
  2. DQN(Deep Q-learning)入门教程(一)之强化学习介绍
  3. DQN(Deep Q-learning)入门教程(二)之最优选择
  4. DQN(Deep Q-learning)入门教程(三)之蒙特卡罗法算法与Q-learning算法
  5. DQN(Deep Q-learning)入门教程(四)之Q-learning Play Flappy Bird
  6. DQN(Deep Q-learning)入门教程(五)之DQN介绍
  7. DQN(Deep Q-learning)入门教程(六)之DQN Play Flappy-bird ,MountainCar

说实话,以6篇博客想来学懂DQN(或者强化学习)是远远不够的,一来,篇幅不够;二来,自己的水平也不够。我仅仅是个初学者,又怎么可能有能力将其讲得广阔而透彻呢?因此,这个系列也仅仅是一个入门系列,最基本的入门。

不过,如果我们对某一个东西有兴趣的话,学习起来也就会事倍功半。它能够站在后面驱使着我们去学习。在个人看来,机器学习本身就是一个好玩的东西(尽管掉了一堆头发,是真的一堆头发,我妈打扫房间的时候还吐槽我怎么掉了这么多头发,/(ㄒoㄒ)/~~),如何进行加快模型的收敛,如何提取有用的信息,如何构建一个好的模型,这些都是值得研究,并且很有意思的东西。我还依稀的记得,当我了解到神经网络总的MP模型的时候,我直接惊呆了,为模型之简介感到惊叹。

这个系列的博客实际上我是写的匆匆忙忙,只花了约一周的时间就写完了。实际上如果我时间很多的话,至少这个系列的博客不会低于15篇,但是,说实话我不敢这样去写。因为我需要考研了,如果写15篇的话,那至少得需要近2个月的时间,这样势必会耽误我的复习,因此也只能这样了。如果我考研能够成功上岸的话,那么我将会更加深入地去了解强化学习以及其优化方法,毕竟那时候时间应该会挺多的。总的来说,还是比较遗憾,无法将这个系列深入学习和写下去。

接下来一段时间,如果没有特殊情况,我基本不会再去写博客,也不会对博客进行更新,如果大家想更加深入的去了解强学习,推荐大家可以去看看:

  • 刘建平Pinard:强化学习
  • UCL Course on RL
  • Reinforcement Learning : An introduction

你可能感兴趣的:(DQN(Deep Q-learning)入门教程(结束)之总结)