百度飞桨强化学习7日打卡营学习心得

百度飞桨强化学习7日打卡营学习心得

百度飞桨在国产开源深度学习框架领域堪称翘楚,尤其是开源了许多训练好的模型,比如CV中的VideoTag(https://github.com/PaddlePaddle/models/tree/develop/PaddleCV/video/application/video_tag) 和NLP里的ERNIE, 堪称业界良心。
最近学习了飞桨团队提供的免费强化学习7日打卡营,介绍了强化学习的入门知识,上手练习了五个项目,提供免费GPU算力,强烈推荐。

简单的入门知识介绍

百度飞桨强化学习7日打卡营学习心得_第1张图片
百度飞桨强化学习7日打卡营学习心得_第2张图片
百度飞桨强化学习7日打卡营学习心得_第3张图片

Sarsa

百度飞桨强化学习7日打卡营学习心得_第4张图片

Q-Learning

百度飞桨强化学习7日打卡营学习心得_第5张图片

DQN

百度飞桨强化学习7日打卡营学习心得_第6张图片

Policy Gradient

百度飞桨强化学习7日打卡营学习心得_第7张图片

DDPG

百度飞桨强化学习7日打卡营学习心得_第8张图片

练习项目介绍

共五个项目,最后一个大作业为使用DDPG解决四轴飞行器悬浮任务,需要调参,可以免费使用GPU, 推荐练习

环境依赖为
paddlepaddle1.6.3
parl
1.3.1
gym

项目使用的RL环境是Baidu开源的PARL库
https://github.com/PaddlePaddle/PARL

示例代码已由官方开源
https://github.com/PaddlePaddle/PARL/tree/develop/examples/tutorials

你可能感兴趣的:(深度学习)