强化学习路线图

人工智能是21世纪最激动人心的技术之一。人工智能,就是像人一样的智能,而人的智能包括感知、决策和认知(从直觉到推理、规划、意识等)。其中,感知解决what,深度学习已经超越人类水平;决策解决how,强化学习在游戏和机器人等领域取得了一定效果;认知解决why,知识图谱、因果推理、持续学习等第三代人工智能正在研究。

强化学习,采用反馈学习的方式解决序贯决策问题,因此必然是通往通用人工智能的终极钥匙。其中,AI 1.0 符号学派, AI 2.0 联结学派,AI 3.0不管是结合也好,另辟蹊径也好,必然离不开行为学派,因为这是自然智能的学习方式。我特别喜欢强化学习,深深被其框架所吸引,智能体通过与环境交互来成长,这不就是生命的进化规律么!

个人作为一名AI独立研究员,一路也是通过知乎、b站、GitHub、公众号和各类博客学习过来,非常感谢网络时代大家的分享,同时将自己在强化学习方面的经验总结整理分享,既是方便自己学习,也希望能帮助一点刷到这条知乎的朋友们。当然,强化学习也面临很多问题,希望我们一起解决,让强化学习变得更好!

https://zhuanlan.zhihu.com/p/104224859

  1. 视频(从入门到放弃)

1.1 腾讯周沫凡(莫烦Python)强化学习、教程、代码

https://www.bilibili.com/video/av16921335?from=search&seid=7037144790835305588

https://mofanpy.com

https://github.com/AndyYue1893/Reinforcement-lear

你可能感兴趣的:(强化学习)