【个人心得】飞桨强化学习7日打卡营学习心得

1 课程回顾

第一次接触强化学习能遇到飞桨的科科老师挺幸运的,在此再次感谢她和她的团队为了这门课程所付出的努力,她能用十分清晰简洁的逻辑将复杂的强化学习算法讲的浅显易懂,让我再次理解到了数学抽象的魅力,也为我备考(考研)路上攻克数学增加了不少动力~

课程链接是:https://aistudio.baidu.com/aistudio/education/group/info/1335
感兴趣的小伙伴可以前往查看哦,有十分详细的录播~

以下是我5课节的笔记分享:
Lesson1: https://blog.csdn.net/qq_41138197/article/details/106934289
Lesson2: https://blog.csdn.net/qq_41138197/article/details/106956647
Lesson3: https://blog.csdn.net/qq_41138197/article/details/106972521
Lesson4: https://blog.csdn.net/qq_41138197/article/details/106972907
Lesson5: https://blog.csdn.net/qq_41138197/article/details/106973290

2 个人收获

2.1 paddlepaddle框架的PARL的使用

不得不说PARL的设计思路真的很棒!它将复杂的模型拆分成Model, Algorithm & Agent三部分,每个部分互相独立,极大地降低了代码的冗余性、提高了代码的复用性(例如,Algorithm可直接调用已有的)、降低了调用、维护和二次开发的学习成本。
【个人心得】飞桨强化学习7日打卡营学习心得_第1张图片

Model: 主要用来定义网络结构

Algorithm: 主要用来定义具体的算法

Agent: 主要负责Algorithm跟Environment的交互

Agent将获取的数据提供给Algorithm,进而更新Model以使其做出“更好地”预测&判断。在Model更新后,Algorithm更新输出数据以使Agent与环境做进一步交互,进而再将获取的新数据反馈给Algorithm,以形成完整的“优化”闭环。

2.2 Linux开发环境配置精进

在这次课程中,Linux开发环境配置这块在不断踩坑之后也更熟悉了,比如,本地N卡的CUDA开启,显卡驱动的排错,Linux启动黑屏修复,Python本地包编译安装后软链接设置默认版本(当然也可以使用pyenv来管理Python版本,但是,我还是觉得自己设置软链接比较高效安全一点,这个就看个人习惯了~)

2.3 分享是最高效的学习方式

在这次课程中,我也会在休息的时候挤些时间出来制作一些个人学习的成果经验分享,比如AIStudio很多小伙伴无法使用GPU环境,其实大部分情况基本都是因为小伙伴没有注意pip安装的paddlepaddle的版本(CPU还是GPU?)或者没有将paddlepaddle升级到最新版本,如果遇到下载慢的情况可以手动更换下载的镜像源,只需要在pip install package后面加个“-i 镜像地址”即可,详细可参考:https://www.bilibili.com/video/BV17t4y197wE/
此外,也碰到了一匹对此感兴趣的同样是初学者的小伙伴,私底下有时也会互相分享交流,感觉这种学习方式所带来的成长远比传统课堂要高效的多,感谢这段时间遇到的飞桨的各位老师和小伙伴~

3 发展展望

人工智能的发展不仅能解放生产力以让我们能更有效地应对人口老龄化现象,还能极大提高公共服务精准化水平,让资源分配更加合理化,从方方面面提升我们的生活品质,随着技术的发展将来肯定还会有更大的应用空间。
【个人心得】飞桨强化学习7日打卡营学习心得_第2张图片飞桨的paddlepaddle框架极大地降低了了解人工智能的门槛,但是想要深入学习,还需要更有选择性方向性的学习&完善,不仅是理论体系的知识,还有实际应用的业务场景,整个体系的搭建。最后,再次感谢飞桨团队的科科老师、芮芮老师&幕后的工作人员,祝国产的paddlepaddle在人工智能这一领域越来越强!
期待你们后续的精品课程哦·~

你可能感兴趣的:(【个人心得】飞桨强化学习7日打卡营学习心得)