CS285

在google.colab中配置mujoco和gym环境

在学习CS285时找了很多方法在google.colab中配置mujoco和gym环境，但由于本身mujoco版本很多，且在被OpenAI收购之前需要申请许可证所以经常环境配置失败，以下为找到的可用解决方案的代码

tj_lzy·2024-02-02 04:25

【CS 285 DRL Homework 1】模仿学习的策略函数

关于CS285深度强化学习Homework1的笔记很少，百度到前年一些同学的笔记，感觉有点不太对。。这里写一些个人理解，敬供各位批评。

·2023-01-13 17:35

【CS 285 DRL Homework 1】模仿学习的策略函数

关于CS285深度强化学习Homework1的笔记很少，百度到前年一些同学的笔记，感觉有点不太对。。这里写一些个人理解，敬供各位批评。

·2023-01-05 16:14

Apple Silicon (mac m1 pro) 完整配置CS285 (brew, miniforge, mujoco)

AppleSilicon配置CS285我的环境是：MacBookPro(14英寸，2021年)，芯片是m1proconda4.12.0,Python3.9.10,mujoco2.1.1（是2.1.1！！

skywuuuu·2022-12-09 19:16

CS285课程笔记（5.(1)）——从概率图角度理解强化学习（变分推断原理+VAE）

Lecture18,19(2020版)这两节课的核心内容就是如何把强化学习问题（又可以称为最优控制问题）转化为一个基于概率图模型的推断问题，这里的推断又可以进一步细分为精确推断（ExactInference）和近似推断(ApproximateInference)。本文先总结lectrue18，即变分推断与变分推断自编码器的基础知识。一、变分推断与变分自编码器（VariationalInferenc

RavenRaaven·2022-12-09 17:51

深度强化学习CS285 lec13-lec15 （下）

逆强化学习IRL概述一、InverseRL背景1.1ImitationLearning与InverseRL1.2StandardRL与InverseRL二、InverseRL2.1Recap2.2MaximumLikelihoodLearning2.3MaximumEntropyIRL2.4GuidedCostLearning2.5GAIL2.6GAIRL后记概述IRL的Motivation：从e

Nemo555·2022-11-29 18:30

深度强化学习CS285 lec13-lec15 （中）

SoftOptimality概述一、概率图基础知识二、SoftOptimalityFramework2.1Recap2.2SoftOptimality与ValueIteration的联系2.3OptimismProblem(关键哦！）2.3.1Optimism问题的引出2.3.2Soft与StandardRL的区别2.3.3Deterministicdynamics的Objective2.3.4S

Nemo555·2022-11-29 18:29

深度强化学习CS285 lec13-lec15 基础知识：变分推断VI与GAN

变分推断VariationalInference、生成对抗网络GAN概述一、简要回顾信息论1.1概念与公式1.2小总结二、变分推断(VariationalInference)2.1背景2.2VariationalInference三、GAN3.1原始GAN3.2“-logDtrick”的GAN小结概述Lec1-Lec4RLIntroduction介绍传统ImitationLearning的背景、算

Nemo555·2022-11-29 18:28

深度强化学习CS285 lec5-lec9（超长预警）

深度强化学习CS285lec5-lec9学习感悟一、策略梯度(PolicyGradient)1.1REINFORCE1.2改进方法1.2.1因果性（Causality）1.2.2基准（Baselines）1.2.3重要性采样（ImportantSampling）二、执行者-评估者(Actor-Critic)2.1优势函数Aπ(st,at)A^\pi(s_t,a_t)Aπ(st,at)（Advant

Nemo555·2022-11-29 18:27

cs285深度强化学习课程笔记-lec1

cs285深度强化学习课程笔记lec1深度强化学习的概念核心观点智能机器必须能学会适应深度学习有助于处理非结构化的环境强化学习提供了一种行为范式深度强化学习提供了端到端的方案。

HarryChi·2022-11-29 18:54

AI绘画发展史(伪)：从免费到吃屎；YSDA·自然语言处理课程8K Star；伯克利CS285·深度强化学习课程；前沿论文 | ShowMeAI资讯日报

日报合辑|电子月刊|公众号下载资料|@韩信子AI绘画发展史(伪)：不能提升生产力的创新，都是伪创新微博博主@西仔LittileC绘制了一份AI绘画发展史，展示了从业者的担忧——并非抗拒技术进步带来的竞争和压力，而是担心已有行业的种种乱象在绘画行业重演，最终导致所有用户被动『吃屎』。大平台免费致使从业人数减少、平台收取低价使用费用、用户必须购买会员/按月订阅/按年订阅才能使用、内容趋同千人一面···

ShowMeAI·2022-10-12 18:36

深度强化学习CS285 lec10-lec12（记得看LQR基础知识）

CS285Model-BasedRL概述一、最优控制与规划（OptimalControlandPlanning）1.1问题分类1.2解决方法1.2.1随机优化方法StochasticOptimization（Continuousaction）1.2.2蒙特卡洛树搜索MCTS（DiscreteAction）1.2.3LQRFramework二、MBRLWithoutPolicyLearning2.1

Nemo555·2022-06-13 07:34

强化学习入门笔记 | UCL silver RL | UC Berkely cs285 DRL

学习情况：先后听了两门课程，分别是DavidSilver的RL和SergeyLevin的DRL。各耗时一周左右，后者更难一些。对RL基本概念、常用算法原理及其伪代码有了大致了解。但是因为时间有点赶，没有敲完整的算法代码。由于已经有写得比较好的课程笔记(RL和DRL)，就不重复造轮子了。两位博主对课程内容理解得都相对透彻，尤其是前者，解答了我很多看视频没太听懂的疑惑。这份笔记是我在听完两门课程后想梳

111辄·2022-03-03 07:10

CS285课程解释_01_为什么是深度强化学习

田青2021/01/12为什么需要强化学习我们先用一个例子来说明一下为什么需要用强化学习来解决问题。例如上图的机器人抓取问题：一个7自由度的机器人手臂，通过一个单目相机的输入（图片），试图用两个手指的夹持器去抓起盘子里的物体。所以，这个问题的输入就是图片，输出就是夹持器的抓取位置的xyz坐标。解决这个问题可能有不同的方式。其中一个方式就是理解问题，并且设计出方案。就像上图中option1所示的那样

bizzard·2021-01-12 21:46

CS285课程解释_00_综述

本文是一个综述，主要说一下写作目的、课程的主要内容、记录一下时间进度等等。写作目的：机器学习和深度学习所引领的这一波人工智能的热潮好像有所降温，但是在研究领域其热度还一直在持续，特别在某些领域，例如深度强化学习，研究的热度还是处于上升趋势，因为大家其实都认识到了一个问题：复杂的控制问题很难有好的解决方式，用学习的方式去学会一种控制方式是一个不错的选择，或者说在没有太多的选择的情况下，起码它是一个选

bizzard·2021-01-08 15:42

4. 2020年秋季UC Berkeley CS285《深度强化学习》第1课：简介和课程概述_4/4【中英字幕】

4.2020年秋季UCBerkeleyCS285《深度强化学习》第1课：简介和课程概述https://www.bilibili.com/video/BV1ZZ4y1V7hy/谢尔盖·莱文（SergeyLevine）加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集，目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂的行为技能感兴趣

守望者白狼·2020-11-07 11:17

3. 2020年秋季UC Berkeley CS285《深度强化学习》第1课：简介和课程概述_3/4【中英字幕】

3.2020年秋季UCBerkeleyCS285《深度强化学习》第1课：简介和课程概述https://www.bilibili.com/video/BV16Z4y1V7m1/谢尔盖·莱文（SergeyLevine）加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集，目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂的行为技能感兴趣

守望者白狼·2020-11-05 10:06

2. 2020年秋季UC Berkeley CS285《深度强化学习》第1课：简介和课程概述_2/4【中英字幕】

2.2020年秋季UCBerkeleyCS285《深度强化学习》第1课：简介和课程概述https://www.bilibili.com/video/BV1LK411P75v/谢尔盖·莱文（SergeyLevine）加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集，目的是开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂的行为技能感兴趣

守望者白狼·2020-11-04 10:49

1. 2020年秋季《UC Berkeley CS285深度强化学习》第1课：简介和课程概述_1/4【中英文双字幕】

1.2020年秋季《UCBerkeleyCS285深度强化学习》第1课：简介和课程概述https://www.bilibili.com/video/BV1Pt4y1e7Td/谢尔盖·莱文（SergeyLevine）加州大学伯克利分校电气工程和计算机科学系助理教授。专注于控制和机器学习之间的交集，开发可使机器具有自主掌握执行复杂任务技能的算法和技术。尤其对如何将学习用于掌握复杂的行为技能感兴趣，以便

守望者白狼·2020-11-03 19:28

Windows下Python的虚拟环境安装Tensorflow

Tensorflow2.x版本并存，我们安装一个Python的虚拟环境，兼容Tensorlfow的各个版本，在本地电脑上运行多个Python环境：（1）Tensorflow2.x的系统运行环境，用于cs294（cs285

段智华·2020-07-01 23:49

推荐频道

CS285

在google.colab中配置mujoco和gym环境

【CS 285 DRL Homework 1】模仿学习的策略函数

【CS 285 DRL Homework 1】模仿学习的策略函数

Apple Silicon (mac m1 pro) 完整配置CS285 (brew, miniforge, mujoco)

CS285课程笔记（5.(1)）——从概率图角度理解强化学习（变分推断原理+VAE）

深度强化学习CS285 lec13-lec15 （下）

深度强化学习CS285 lec13-lec15 （中）

深度强化学习CS285 lec13-lec15 基础知识：变分推断VI与GAN

深度强化学习CS285 lec5-lec9（超长预警）

cs285深度强化学习课程笔记-lec1

AI绘画发展史(伪)：从免费到吃屎；YSDA·自然语言处理课程8K Star；伯克利CS285·深度强化学习课程；前沿论文 | ShowMeAI资讯日报

深度强化学习CS285 lec10-lec12（记得看LQR基础知识）

强化学习入门笔记 | UCL silver RL | UC Berkely cs285 DRL

CS285课程解释_01_为什么是深度强化学习

CS285课程解释_00_综述

4. 2020年秋季UC Berkeley CS285《深度强化学习》第1课：简介和课程概述_4/4【中英字幕】

3. 2020年秋季UC Berkeley CS285《深度强化学习》第1课：简介和课程概述_3/4【中英字幕】

2. 2020年秋季UC Berkeley CS285《深度强化学习》第1课：简介和课程概述_2/4【中英字幕】

1. 2020年秋季《UC Berkeley CS285深度强化学习》第1课：简介和课程概述_1/4【中英文双字幕】

Windows下Python的虚拟环境安装Tensorflow