深度强化学习(资源篇)(更新于2020.06.9)

理论
ICLR2020 || 106篇深度强化学习顶会论文汇总
前沿技术 || UC Berkeley开源RAD来改进强化学习算法
加速RL探索效率,CMU、谷歌、斯坦福提出以弱监督学习解纠缠表征
强化学习如何使用内在动机?
边做边思考,谷歌大脑提出并发RL算法,机械臂抓取速度提高一倍!
除了网红,强化学习也能带货?
David Sliver || 2020年最新讲解AlphaGo, AlphaZero and DeepRL
博士万字总结 || 多智能体强化学习(MARL)大总结与论文详细解读
谷歌发布离线强化学习新范式,克服RL智能体只能在线训练难题,训练集相当于200多个ImageNet
谷歌推出全新强化学习智能体,1秒处理240万帧大幅超越IMPALA
霸榜马里奥赛车,谷歌将神经进化引入自解释智能体,强化学习训练参数锐减1000倍
“事后诸葛亮”经验池:轻松解决强化学习最棘手问题之一:稀疏奖励
顶会论文 || 65篇"IJCAI"深度强化学习论文汇总
强化学习之路——清华博士后解读83篇文献,万字长文总结
2019年深度强化学习十大必读论文!DeepMind、OpenAI等上榜
超有趣!LSTM之父团队最新力作:将强化学习“颠倒”过来
<<八千字长文深度解读,迁移学习在强化学习中的应用及最新进展
获顶会最佳论文,天津大学等用强化学习寻找游戏bug
通往量子霸权之路:谷歌用强化学习优化量子门控制策略
学界 | 如何得到稳定可靠的强化学习算法?微软两篇顶会论文带来安全的平滑演进
学界 | 让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法
<从认知学到进化论,详述强化学习两大最新突破
<谷歌的 PlaNet 强化学习网络
<谷歌提出强化学习新算法SimPLe,模拟策略学习效率提高2倍
DeepMind综述深度强化学习中的快与慢,智能体应该像人一样学习
DeepMind发布新奖励机制:让智能体不再“碰瓷”
Pieter Abbeel:深度强化学习加速方法
从虚拟到现实,北大等提出基于强化学习的端到端主动目标跟踪方法
DeepMind提出关系RNN:构建关系推理模块,强化学习利器
AAAI 2019 | 基于分层强化学习的关系抽取
动态 | 谷歌 AI 最新博文:视频模型中的模拟策略学习
PARL源码走读:使用策略梯度算法求解迷宫寻宝问题
在线元学习:通过持续元学习解决传统机器学习方式的致命不足
强化学习中,如何从稀疏和不明确的反馈中学习泛化
腊月廿八 | 强化学习-TRPO和PPO背后的数学
AAAI 2019论文解读:机器人和认知学习
一行代码搞定 Scrapy 随机 User-Agent 设置
让智能体主动交互,DeepMind提出用元强化学习实现因果推理
效率提高50倍!谷歌提出从图像中学习世界的强化学习新方法
用于深度强化学习的结构化控制网络(ICML 论文讲解)
强化学习基础-对偶梯度上升
强化学习基础 - 共轭梯度
量化深度强化学习算法的泛化能力
<让机器帮你做决策!强化学习在智能交互搜索的应用分享
<深度强化学习从入门到大师:以刺猬索尼克游戏为例讲解PPO(第六部分)
<深度强化学习从入门到大师:简单介绍A3C (第五部分)
<深度强化学习从入门到大师:以 Cartpole 和 Doom 为例介绍策略梯度 (第四部分)
<深度强化学习从入门到大师:进一步了解深度Q学习(第三部分 - 下)
<深度强化学习从入门到大师:以Doom为例一文带你读懂深度Q学习(第三部分 - 上)
<深度强化学习从入门到大师:通过Q学习进行强化学习(第二部分)
<深度强化学习从入门到大师:简介篇(第一部分)
学习何时做分类决策,深度好奇提出强化学习模型Jumper
深度强化学习中的好奇心
NIPS 2018 | Spotlight论文:凭借幻想的目标进行视觉强化学习
伯克利、OpenAI等提出基于模型的元策略优化强化学习
BAIR讲述如何利用深度强化学习控制灵活手
自学习 AI 智能体第二部分:深度 Q 学习
自学习 AI 智能体第一部分:马尔科夫决策过程
滴滴 KDD 2018 论文详解:基于强化学习技术的智能派单模型
澳门大学讲座教授陈俊龙:从深度强化学习到宽度强化学习:结构,算法,机遇及挑战

项目
不需要借助GPU的力量,用树莓派也能实时训练agent玩Atari
谷歌、DeepMind 联合发布 Dreamer:性能远超 PlaNet,数据效率创新高
强化学习常用算法+实际应用 ,必须get这些核心要点!
干货 | 深度强化学习实现全家桶
百度PARL再度夺冠NeurIPS仿生人挑战赛:强化学习控制的流畅行走
IJCAI 2019 | 有趣!这是一篇玩倩女幽魂的多智能体强化学习研究
6行代码搞定基本的RL算法,速度围观Reddit高赞帖
快速上手深度强化学习?学会TensorForce就够了
仅需2小时学习,基于模型的强化学习方法可以在Atari上实现人类水平
用深度Q网络玩电子游戏
DeepMind让AI组队踢足球学会“合作”,并开源训练环境
Github项目推荐 | GtS 仿真泛化:将仿真和真实数据集成到基于视觉的自主飞行深度强化学习中
围棋 AI ELF OpenGo 迎来更新,另有田渊栋呈上开源项目的详细解读
详解深度强化学习展现TensorFlow 2.0新特性(代码)
如何在TensorFlow 2.0中构建强化学习智能体
开源啦:连DeepMind也捉急的游戏,OpenAI给你攻破第一关的高分算法
如何保持运动小车上的旗杆屹立不倒?TensorFlow利用A3C算法训练智能体玩CartPole游戏
基于TensorFlow的强化学习,在《毁灭战士》游戏里训练Agent
<博客 | 任务型对话系统公式建模&&实例说明

/////////////////////////////模型框架/////////////////////////////
17种深度强化学习算法用Pytorch实现
清华本科生开发强化学习平台「天授」:千行代码实现,性能吊打国外成熟平台,刚刚开源
谷歌推出分布式强化学习框架SEED,性能“完爆”IMPALA,可扩展数千台机器,还很便宜
从“小”培养AI安全意识:OpenAI开源最新强化学习训练工具,安全约束自由定制,开箱即用
集合三大类无模型强化学习算法,BAIR开源RL代码库rlpyt
花最少的钱,训超6的机器人:谷歌大脑推出机器人强化学习平台,硬件代码全开源
卡牌游戏八合一,华人团队开源强化学习研究平台RLCard
谷歌发布一个新的强化学习环境:Google Research Football
OpenAI重磅发布Nueral MMO:一个CPU支撑大量智能体同时在线
3D 环境训练智能体时代来临?Facebook 开源仿真 3D 环境平台 Habitat
谷歌开源强化学习深度规划网络 PlaNet
夺魁NeurIPS 2018强化学习大赛,百度正式发布RL模型库和算法框架PARL
DeepMind 开源TRFL,又一个强化学习复现、创新好帮手
强化学习工具Horizon开源:Facebook曾用它优化在线视频和聊天软件
Facebook开源首个适应大规模产品的强化学习平台Horizon,基于PyTorch 1.0
探索新的强化学习算法遇到困难?不怕不怕,谷歌为你带来「多巴胺」
「多巴胺」来袭!谷歌推出新型强化学习框架Dopamine
TensorFlow Agents日前开源,轻松在TF中构建并行强化学习算法

资讯
6小时完成芯片布局,谷歌用强化学习助力芯片设计
“国产莱卡狗”走进谷歌AI Lab, 强化学习算法让机器狗漫步溜达似真狗
FIFA变身AI主场:谷歌推出强化学习“足球引擎”完爆人类玩家
人类一败涂地?DeepMind推出Agent57,在所有雅达利游戏上超越人类玩家
《强化学习》可复现性?稳健性?Joelle Pineau无情揭示问题
强化学习大佬, TRPO/GAE/PPO提出者 || John Schulman谈:“如何做科研?”
观点 | 深度强化学习这块,有人说我们已经触顶了……
机器人学前班助力机器人简单快速学习,给予强化学习的自动驾驶策略
从头开始强化学习
如何利用强化学习设计出更好的火箭发动机
O’Reilly纽约AI Conference“游记”:AI应用加速落地,强化学习更受关注
观点 | 我在谷歌大脑工作的 18 个月中,是怎样研究强化学习的?
Facebook在加拿大成立AI实验室,专注强化学习研究
一图尽展视频游戏AI技术,DQN无愧众算法之鼻祖
使用强化学习训练机械臂完成人类任务
《经济学人》万字长文:DeepMind和谷歌的AI拉锯战
深度强化学习新趋势:谷歌如何把好奇心引入强化学习智能体
业界 | BAIR讲述如何利用深度强化学习控制灵活手
华为 AAAI 2019 入选论文出炉,两篇论文都是强化学习相关
谷歌和UC伯克利的新式Actor-Critic算法快速在真实世界训练机器人
新的一年,DeepMind准备让AI学会「放烟花」
真的超越了波士顿动力!深度强化学习打造的 ANYmal 登上 Science 子//////刊
用AI设计微波集成电路,清华大学等提出深度强化学习方法RINN
EMNLP 2018 | 用强化学习做神经机器翻译:中山大学&MSRA填补多项空白
你需要新的好奇心方法克服强化学习中的拓展症
超越DQN和A3C:深度强化学习领域近期新进展概览
谷歌大脑用强化学习为移动设备量身定做最好最快的CNN模型

/////////////////////////////课程、书籍、文档/////////////////////////////
B站教学,全中文课程:港中文周博磊强化学习课程完结
2小时学强化学习?DeepMind 首席科学家、原牛津大学教授Nando教程来了
Bengio、Sutton的深度学习&强化学习暑期班又来了,2019视频已放出
赠书:Sutton老爷子经典之作,《强化学习》中文第2版
资料 | 强化学习精要:核心算法与TensorFlow 实现
博客 | ICML 2019 深度强化学习文章汇总
博客 | 过去10年NIPS顶会强化学习论文(100多篇)汇总(2008-2018年)
【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载
Github项目推荐 | 最优控制、强化学习和运动规划等主题参考文献集锦
Github项目推荐 | 中文整理的强化学习资料(Reinforcement Learning)
资源|434页《python强化学习实践》(附 pdf 与完整代码)
2019年度最佳书单:深度学习+机器学习+强化学习
【干货】谷歌大脑:元学习最新进展与挑战(40 PPT下载)
<140页《深度强化学习入门》发布
DeepMind推出深度学习与强化学习进阶课程(附视频)
MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)
<伯克利CS294深度强化学习课程资料放出(PPT+录像),
<重磅 | CS 294 2018 今日开课!双语字幕独家上线!
动态 | 从零开始快速入门深度强化学习,OpenAI 发布学习资源 Spinning Up
人人能上手:OpenAI发射初学者友好的强化学习教程 | 代码简约易懂
MILA 2018夏季深度学习与强化学习课程资源大放送
《深度强化学习》手稿开放了!
OpenAI开课了!深度强化学习最全课程包,教程、代码、习题、文档一网打尽
从Zero到Hero,OpenAI重磅发布深度强化学习资源
MIT 6.S094· 深度增强学习 | 学霸的课程笔记,我们都替你整理好了

你可能感兴趣的:(深度强化学习)