斯坦福大学2017年-Spring-最新强化学习(Reinforcement Learning)课程分享

课程说明

为了实现人工智能的梦想,我们需要学习出可以进行自主决策的系统。强化学习就是实现这一目标的强有力的例子,它与包括机器人、游戏、消费者画像和医疗保健在内的各种任务息息相关。本门课程将详细介绍强化学习领域的基础知识,学生们将会学习到强化学习核心方法和技术,包括如何进行泛化(Generalization)和探索(Exploration)。通过专家讲座、书面课程和线下编码任务相结合的方式,学生将会深入了解强化学习的关键思想和技巧。作业将包括强化学习的基础知识、以及深度强化学习相关知识-这是一个非常有前途的新领域,将深度学习技术与强化学习相结合。此外,通过线下的开放性项目,学生将提升他们对强化学习的理解。

学习目标

在课程结束后,学生应该能够

· 定义强化学习的关键特征,这也是区分AI和非交互式机器学习的关键特征

· 定义MDP,POMDP,bandit,batch offline 强化学习,online 强化学习

· 描述研究 VS 应用的挑战,并比较和对比至少两种方法来应对这一挑战

· 给定一个应用问题(例如,计算机视觉,机器人等)决定是否应该被定为一个强化学习问题,如果是,如何制定,应该采用什么算法来处理这个问题,并证明答案正确性。

· 实现包括深度强化学习算法在内的常见强化学习算法

· 学习分析强化学习算法和评估这些算法的多个标准:例如regret,样本复杂度(sample complexity),计算复杂度,收敛性等。

· 列出强化学习领域中至少两个开放的挑战或热门话题

课程大纲

斯坦福大学2017年-Spring-最新强化学习(Reinforcement Learning)课程分享_第1张图片 斯坦福大学2017年-Spring-最新强化学习(Reinforcement Learning)课程分享_第2张图片

课程ppt等资料下载地址:

链接: pan.baidu.com/s/1bpq7xO

密码: 公众号回复“SRL”

往期精彩内容分享

神经机器翻译(NMT)的一些重要资源分享

《模型汇总-20》深度学习背后的秘密:初学者指南-深度学习激活函数大全

深度学习与NLP 深度学习|机器学习|人工智能 精品视频教程合集分享

纯干货-8 21套深度学习相关的视频教程分享

模型汇总-12 深度学习中的表示学习_Representation Learning

<纯干货-4> 加州伯克利大学2017年最新深度强化学习视频课程_part3

<深度学习优化策略-3> 深度学习网络加速器Weight Normalization_WN

你可能感兴趣的:(深度学习,深度学习模型汇总,深度学习优化策略汇总,生成对抗网络GAN,深度强化学习DRL)