百度强化学习7日打卡营心得体会

之所以想了解强化学习,主要是因为,在自己学校的深度学习课程展示中,看到其他小组用深度强化学习来玩游戏,觉得很有意思。但是这学期没有选修强化学习课程,自己感觉有点遗憾。也有想过找一个系统的强化学习课程学习一下,但是又觉得单纯为一时兴趣耗费太多时间不值(主要是研究方向和强化学习相关性很小。。。),就作罢了。正巧在微信公众号里看到百度强化学习7日打卡营,授课教师来自NIPS竞赛世界冠军团队,而且正值各门课程期末大作业的间隙,犹豫再三后就报名了。

因为自己本身有模式识别和机器学习基础,听这门课感觉并不吃力,觉得科科老师讲课幽默诙谐、深入浅出,能够用很平易近人的语言将RL各个算法的本质讲解清楚,讲解代码的时候逻辑特别清晰,语言组织能力和表达能力都很强。我觉得自己的听课体验很好。

这门课不仅讲理论,而且也提供了实践的机会,基于PARL框架和PaddlePaddle,在gym和atari平台上玩游戏,让学员体会到训练模型和调参的乐趣。说到调参,我之前一直没有过多关注,调研重点还是在网络结构设计背后的理论上,比较注重motivation。这次打卡营,我发现自己调参的能力不够,有几个很简单的游戏也没有拿到很好的分数。还好,在作业讨论区,有很多同学热心地分享调参经验,如变化学习率,中途保存模型等等,让我学到很多。科科老师作为团队核心成员,工作应该也是很忙的,但是依然抽时间在作业讨论区回答学员的问题,非常认真负责。

在现如今Tensorflow和Pytorch已经被广泛接受的情况下,百度还开发自己的深度学习框架PaddlePaddle,实属难得。说到RL框架——PARL,使用体验很好,个人感觉上手不难。希望在以后的科研过程中,能更多地用上中国公司开发的工具。

总体来说,这次百度强化学习7日打卡营,是一次非常用心的公益课程,不仅免费,而且还准备了很多小礼物,我还幸运地抽奖得到一本书,哈哈。这次学习营,也算满足了我想了解RL的冲动吧。

你可能感兴趣的:(百度强化学习7日打卡营心得体会)