关于飞桨深度学习学院《强化学习7日打卡训练营》的一点心得体会

1 引言

积跬步以至千里,积怠情以至深渊,我要做一个踏实的ABCer。

本文将介绍在近期听讲飞桨深度学习学院《强化学习7日打卡训练营》的一点心得体会,该课程由百度NeurIPS全球顶会冠军团队亲自授课,授课老师讲解深入浅出,零基础入门强化学习!特讲此次学习相关笔记整理如下~

2 关于PaddlePaddle/PARL

经过此次课程的参与,最大的收获应该就在于了解了基于百度 PaddlePaddle 打造的深度强化学习框架PaddlePaddle PARL。通过完成的几个课程作业,初步掌握了这个框架的使用。

个人体会:PaddlePaddle PARL 凝聚了百度多年来在强化学习领域的技术深耕和产品应用经验。与现有强化学习工具和平台相比,PaddlePaddle PARL 具有更高的可扩展性、可复现性和可复用性,强大的大规模并行化和稀疏特征的支持能力,以及工业级应用案例的验证。这个框架对于初步踏入强化学习领域的新手来说,相对友好,封装了RL相关的经典算法,方便使用,并进行验证诸多RL场景。

框架的github地址,部分目录结构如下,
关于飞桨深度学习学院《强化学习7日打卡训练营》的一点心得体会_第1张图片

3 关于授课内容

关于飞桨深度学习学院《强化学习7日打卡训练营》的一点心得体会_第2张图片
虽然在参与课程前,已经对课程涉及的这些强化学习经典算法已经有了一定的了解和掌握。但还是被“百度NeurIPS全球顶会冠军团队亲自授课”这个头衔以及结课奖励所吸引。
但通过参与课程,发现重温一遍这些算法也是受益匪浅的。科科老师授课内容真的深入浅出,令人易于理解,也让我对强化学习的知识得到了进一步的巩固。并且使用PaddlePaddle/PARL完成了下图所示的几个作业内容,学会使用了一个新的深度强化学习框架。
关于飞桨深度学习学院《强化学习7日打卡训练营》的一点心得体会_第3张图片

你可能感兴趣的:(PARL,RL,飞桨深度学习学院)