强化学习七日打卡营学习心得

之前在准备毕业论文时接触了强化学习的思想,后面断断续续的看了一些强化学习的经典算法,从事自动驾驶相关研究之后,总是期望将强化学习用于该领域,并期望可以实现落地。
偶然机会看到了百度强化学习7日打卡营的活动,决定尝试着听一下。以下是该打卡营的简介:
https://aistudio.baidu.com/aistudio/education/group/info/1335
谈一下课程的优点:
1- 由于该课程定位是入门课程,因此课程设置由浅入深,且每节课都有实战作业,这样便于在课后作业中对课程内容进行回顾。
2- 课程老师比较负责,看得出来是用心准备了课件和实践内容,讲解细致,能够及时纠错,不像有些课程的老师在网上搜个PPT就拿来讲
3- 实践内容给予百度的AIstudio平台,便于存储,且能够在不同地点使用。基于notebook的形式,直观、快速、便捷。
4- 课程内容丰富,体系健全,从表格式的强化学习算法,到融入了深度神经网络的DQN,再到策略梯度,最后是融合两者的AC框架,监管学习天数较短,但完整的课程体系便于入门者日后深入学习。
5- PARL的高效和便捷。之前没有接触过百度的强化学习框架PARL,此次课程也确实是在推广PARL,但使用后也确实感受到该框架在验证算法方面存在可取之处,当你纠结于使用哪种深度强化学习算法时,你可以在不修改environment和agent的前提下就测试各种model的效果,真的很方便。
在实践环节中,对于调参真的是让大家痛不欲生又欲罢不能,希望以后增强这方面的经验,也期望自己可以在后续的学习中随着经验的积累,掌握些参数自适应的算法。

你可能感兴趣的:(强化学习)