E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
深度强化学习
Python 爬虫自动下载OpenAI Key Papers
SpinningUp是OpenAI开源的面向初学者的
深度强化学习
资料,其中列出了105篇
深度强化学习
领域非常经典的文章,见SpinningUp:博主使用Python爬虫自动爬取了所有文章,而且爬下来的文章也按照网页的分类自动分类好
梦逸清尘
·
2023-04-01 22:13
Python
python
人工智能
自动驾驶决策规划-控制方向2023届秋招总结
1.基本情况985本硕,研究方向是
深度强化学习
与机器人控制。今年秋招投递的岗位主要是自动驾驶的决策规划或控制岗位,当然前期也投递了一些机器人公司的规划控制岗位和部分机器学习算法岗位。
CHH3213
·
2023-04-01 09:36
自动驾驶
自动驾驶
人工智能
机器学习
深度强化学习
加载Atari游戏运行库:Could not find module “XXXX\lib\site-packages\atari_py\ale_interface\ale_c.dll“
深度强化学习
加载Atari游戏运行库:Couldnotfindmodule"XXXX\lib\site-packages\atari_py\ale_interface\ale_c.dll"与train.py
Ezekiel Mok
·
2023-03-31 08:21
Python
python
开发语言
算法
actor-critic代码逐行解析(tensorflow版)
深度强化学习
算法actor-critic代码逐行解析(tensorflow版)Actor是基于Policy-Gradients。可以选择连续动作,但是必须循环一个回合才可以更新策略。学习效率低。
温州草履虫
·
2023-03-31 03:24
tensorflow
【
深度强化学习
】(4) Actor-Critic 模型解析,附Pytorch完整代码
大家好,今天和各位分享一下
深度强化学习
中的Actor-Critic演员评论家算法,Actor-Critic算法是一种综合了策略迭代和价值迭代的集成算法。
立Sir
·
2023-03-31 02:08
深度强化学习
python
pytorch
强化学习
深度强化学习
人工智能
深度学习模型保存_TensorFlow 2 模型:
深度强化学习
文/李锡涵,GoogleDevelopersExpert本文节选自《简单粗暴TensorFlow2》,回复“手册”获取合集在很久之前就应该介绍TensorFlow中的
深度强化学习
的,是的,终于完成了!
weixin_39782355
·
2023-03-29 23:47
深度学习模型保存
深度强化学习
从入门到秃头--合集
跟
深度强化学习
(DeepReinforcementLearning,DRL)相爱相杀已经四年了,如果把本科毕业设计那半年也算上就有四年半了,放在科研这种“长途旅行”上也算是有一段时间了。
ZRay111
·
2023-03-27 10:10
【分享NVIDIA GTC大会干货】基于真实世界的数据集的
深度强化学习
基于真实世界的数据集的
深度强化学习
前言一、离线强化学习基础1.1离线RL和模仿学习对比1.2ConservativeQ-learning1.3PTR二.机器人技术的离线RL预训练2.1PTR三.大型语言模型的离线
lvzt
·
2023-03-25 20:11
深度学习
CUDA
机器学习
人工智能
算法
量化
深度强化学习
算法的泛化能力
OpenAI近期发布了一个新的训练环境CoinRun,它提供了一个度量智能体将其学习经验活学活用到新情况的能力指标,而且还可以解决一项长期存在于强化学习中的疑难问题——即使是广受赞誉的强化算法在训练过程中也总是没有运用监督学习的技术,例如Dropout和BatchNormalization。但是在CoinRun的泛化机制中,OpenAI的研究人员们发现这些方法其实有用,并且他们更早开发的强化学习会
IT派
·
2023-03-25 12:45
百度PaddlePaddle再获新技能 智能推荐、对话系统、控制领域都能搞定!
PARL是基于百度PaddlePaddle打造的
深度强化学习
框架,覆盖了DQN、DDQN、
PaddleWeekly
·
2023-03-23 04:02
Arxiv网络科学论文摘要7篇(2019-08-16)
使用潜在图卷积网络进行复杂多图的端到端学习;当你的朋友成为卖家:社交商务网站北电的实证研究;GitHub生态系统的大规模多主体数据驱动模拟;基于闲言碎语的普适推荐系统信息传播;在世界-地球系统模型中使用
深度强化学习
发现可持续管理战略
ComplexLY
·
2023-03-22 21:53
【
深度强化学习
】(7) SAC 模型解析,附Pytorch完整代码
大家好,今天和各位分享一下SAC(SoftActorCritic)算法,一种基于最大熵的无模型的
深度强化学习
算法。
立Sir
·
2023-03-19 08:21
深度强化学习
pytorch
python
强化学习
深度强化学习
人工智能
【
深度强化学习
】(6) PPO 模型解析,附Pytorch完整代码
大家好,今天和各位分享一下
深度强化学习
中的近端策略优化算法(proximalpolicyoptimization,PPO),并借助OpenAI的gym环境完成一个小案例,完整代码可以从我的GitHub中获得
立Sir
·
2023-03-19 08:21
深度强化学习
pytorch
深度学习
python
强化学习
深度强化学习
【
深度强化学习
】(5) DDPG 模型解析,附Pytorch完整代码
大家好,今天和各位分享一下深度确定性策略梯度算法(DeterministicPolicyGradient,DDPG)。并基于OpenAI的gym环境完成一个小游戏。完整代码在我的GitHub中获得:https://github.com/LiSir-HIT/Reinforcement-Learning/tree/main/Model1.基本原理深度确定性策略梯度算法是结合确定性策略梯度算法的思想,对
立Sir
·
2023-03-19 08:20
深度强化学习
pytorch
python
强化学习
深度强化学习
DDPG
【
深度强化学习
】(8) iPPO 模型解析,附Pytorch完整代码
大家好,今天和各位分享一下多智能体
深度强化学习
算法ippo,并基于gym环境完成一个小案例。
立Sir
·
2023-03-19 08:19
深度强化学习
人工智能
pytorch
python
强化学习
深度强化学习
深度强化学习
2:Proximal Policy Optimization算法(PPO)
【李宏毅
深度强化学习
笔记】2、ProximalPolicyOptimization算法(PPO)qqqeeevvv2020-01-1515:00:016525收藏12分类专栏:#理论知识强化学习最后发布
AI_Younger_Man
·
2023-03-15 07:34
#
强化学习
#
理论知识
强化学习
【
深度强化学习
】(2) Double DQN 模型解析,附Pytorch完整代码
大家好,今天和大家分享一个
深度强化学习
算法DQN的改进版DoubleDQN,并基于OpenAI的gym环境库完成一个小游戏,完整代码可以从我的GitHub中获得:https://github.com/LiSir-HIT
立Sir
·
2023-03-11 08:34
深度强化学习
python
pytorch
强化学习
DQN
深度强化学习
【
深度强化学习
】(1) DQN 模型解析,附Pytorch完整代码
大家好,今天和各位讲解一下
深度强化学习
中的基础模型DQN,配合OpenAI的gym环境,训练模型完成一个小游戏,完整代码可以从我的GitHub中获得:https://github.com/LiSir-HIT
立Sir
·
2023-03-11 08:04
深度强化学习
python
强化学习
深度强化学习
DQN
pytorch
【强化学习】多智能体强化学习框架PYMARL
简介pymarl是由英国牛津大学计算机科学系机器学习研究组WhiRL部署的
深度强化学习
框架,实现包括以下算法:QMIX:QMIX:MonotonicValueFunctionFactorisationforDeepMulti-AgentReinforcementLearningCOMA
夕阳下的奔跑517
·
2023-03-11 08:34
深度学习
人工智能
【
深度强化学习
】(3) Policy Gradients 模型解析,附Pytorch完整代码
大家好,今天和各位分享一下基于策略的
深度强化学习
方法,策略梯度法是对策略进行建模,然后通过梯度上升更新策略网络的参数。我们使用了OpenAI的gym库,基于策略梯度法完成了一个小游戏。
立Sir
·
2023-03-11 08:33
深度强化学习
pytorch
python
强化学习
深度强化学习
策略梯度
2020-04-23 纸片 10
本文通过
深度强化学习
算法对该现象涉及到的流体流动进行模拟,分析其中的规律。introduction将三维N-S方程数值
亻令仃忝鉂
·
2023-03-10 14:02
基于torch库和强化学习的屏风四子棋算法
一种完全基于
深度强化学习
的方法。使用一个神经网络经过训练来预测自己应该的下棋位置和获胜概率,同时又通过MCTS树搜索方法不断提升神经网络的能力,使神经网络在一次次迭代中不断获得更高质量的预测效果。
PZO大笨鹅
·
2023-03-09 04:10
强化学习笔记【5】近端策略优化(PPO)算法
该系列主要是听李宏毅老师的《
深度强化学习
》过程中记下的一些听课心得,除了李宏毅老师的强化学习课程之外,为保证内容的完整性,我还参考了一些其他的课程,包括周博磊老师的《强化学习纲要》、李科浇老师的《百度强化学习
开心果小李
·
2023-03-08 21:37
强化学习
李宏毅
学习笔记
汪昭然:构建“元宇宙”和理论基础,让
深度强化学习
从虚拟走进现实
作者|陈彩娴
深度强化学习
的故事,可以追溯到2015年:当时,位于英国伦敦的一家小公司DeepMind在《Nature》上发表了一篇文章“Human-levelcontrolthroughdeepreinforcementlearning
喜欢打酱油的老鸟
·
2023-02-25 07:06
人工智能
使用DQN进行价格管理
虽然有广泛的传统优化方法可用于库存和价格管理应用,但
深度强化学习
定价有潜力大幅提高这些和其
纯洁の小黄瓜
·
2023-02-25 07:25
供应链-时序预测-运筹优化
大数据
人工智能
强化学习
定价策略
收益管理
论文笔记-Deteministic Policy Gradient Algorithms
策略梯度算法广泛运用在
深度强化学习
中的连续控制领域。策略梯度算法的主要意思是用参数概率分布πθ(a∣s)=P[a∣s;θ]\pi_{
蚍蜉_
·
2023-02-24 07:16
论文笔记
机器学习
强化学习
DDPG
深度强化学习
从认知学到进化论,详述强化学习两大最新突破
不过,
深度强化学习
过程往往需要大量的训练数据。正因如此
喜欢打酱油的老鸟
·
2023-02-21 07:17
人工智能
从认知学到进化论
详述强化学习两大最新突破
强化学习两大最新突破
从认知学到进化论
百度NLP:强化学习之原理与应用
强化学习之原理与应用强化学习特别是
深度强化学习
近年来取得了令人瞩目的成就,除了应用于模拟器和游戏领域,在工业领域也正取得长足的进步。百度是较早布局强化学习的公司之一。
百度NLP
·
2023-02-07 10:09
百度NLP
百度
NLP
强化学习
自然语言处理
AI
基于
深度强化学习
的绘画智能体 代码分析(五)
GIthub源码wgan.pyimporttorchimporttorch.nnasnnimportnumpyasnpfromtorch.optimimportAdam,SGDfromtorchimportautogradfromtorch.autogradimportVariableimporttorch.nn.functionalasFfromtorch.autogradimportgrada
夸克喵
·
2023-02-06 13:42
绘画智能体代码分析
pytorch
深度学习
神经网络
基于
深度强化学习
的进化多目标优化自适应算子选择
进化算法(EA)已经成为多目标优化的最有效技术之一,其中已经开发了许多变异算子来处理具有各种困难的问题。虽然大多数EA始终使用固定的运算符,但为新问题确定最佳EA是一个劳动密集型过程。因此,最近的一些研究致力于在搜索过程中自适应选择最佳算子。为了解决操作算子选择中的探索与开发困境,本文提出了一种基于强化学习的新算子选择方法。在该方法中,决策变量被视为状态,候选算子被视为动作。通过使用深度神经网络学
kininee
·
2023-02-05 08:26
多目标优化
人工智能
算法
大数据
深度强化学习
-A3C算法
论文地址:https://arxiv.org/pdf/1602.01783v1.pdfA3C(异步优势演员评论家)算法,设计该算法的目的是找到能够可靠的训练深度神经网络,且不需要大量资源的RL算法。在DQN算法中,为了方便收敛使用了经验回放的技巧。A3C更进一步,并克服了一些经验回放的问题。如,回放池经验数据相关性太强,用于训练的时候效果很可能不佳。举个例子,我们学习下棋,总是和同一个人下,期望能
athrunsunny
·
2023-02-04 21:59
强化学习
趣谈什么是深度学习
海量的数据驱动(3)强大的计算平台5.深度学习的分类(1)破译图像的密码——卷积神经网络(2)洞悉语言的内涵——循环神经网络(3)棋逢对手,伯仲之间——生成对抗网络(4)纸上得来终觉浅,绝知此事须躬行——
深度强化学习
人工智能教育
·
2023-02-04 14:09
神经网络
机器学习
人工智能
python
深度学习
深度强化学习
(3):策略学习篇
王树森老师《
深度强化学习
基础》学习笔记三、策略学习(Policy-BasedReinforcementLearning)用一个神经网络(policynetwork,策略网络)近似策略函数,用于控制Agent
Sudaa、
·
2023-02-02 15:47
科研
深度学习
神经网络
机器学习
DDPG玩Pendulum-v0
参考莫烦和Keras
深度强化学习
–DPG与DDPG实现,代码actor有两个网络,ae接受当前状态s,计算当前行为a,并执行a,at接受下个状态s_,计算下个行为a_,传给ct,通过最大化q(最小化-q
安達と島村
·
2023-02-02 12:34
python
机器学习
tf
tensorflow
深度学习
神经网络
【Pytorch项目实战】之强化学习:Q-Learning、SARSA、DQN
State-Action-Reward-State-Action)算法三:DQN(DeepQ-Network)(一)实战:基于Q-Learning算法的强化学习(二)实战:基于SARSA算法的强化学习(三)实战:基于DQN算法的
深度强化学习
强化学习
胖墩会武术
·
2023-02-01 20:44
深度学习
Pytorch项目实战
pytorch
深度学习
人工智能
python
强化学习
ros常用命令(长期修改,自己复制粘贴参阅用)
文章目录配置
深度强化学习
环境时常用的命令ros环境变量ubuntu命令ros常用命令遇到的问题配置
深度强化学习
环境时常用的命令创建完环境变量指令echo'exportPATH="/home/yourname
哥斯拉-
·
2023-02-01 17:44
ROS学习
ubuntu
linux
tensorflow
深度强化学习
DQN算法
目录一.算法介绍二.算法原理三.代码实现[1]参考一.算法介绍DQN算法,英文名为DeepQNetwork,被称为深度Q网络,其将深度神经网络结合了Q-learning。传统的Q-learning使用表格的方式记录状态、动作对应的Q值,这样的方法在处理大规模问题上会占用极大的内存,可能存在的状态数量过于庞大无法列出表格,即维度爆炸。因此科学家们将神经网络与Q-learning进行结合,用神经网络就
安城安教具
·
2023-02-01 10:42
多智能体深度强化学习
神经网络
深度学习
人工智能
机器学习
算法
深度强化学习
算法(朴素DQN,DDQN,PPO,A3C等)比较与实现
不同算法的理论比较部分参考CSDN博客-专业IT技术发表平台,代码实现在python完成。用的算例是OpenAI官网gym提供的算例环境"CartPole-v1"游戏,代码实现部分在谷歌全家桶(Colab,tensorflow2,wandb)中完成1.朴素DQN原论文:[DQN]PlayingAtariwithDeepReinforcementLearning[1]Off-policy,Discr
lblbc
·
2023-02-01 07:25
算法
深度学习
python
【论文笔记】基于强化学习的车间调度问题研究简述
目录摘要关键字引言1背景1.1车间调度问题1.1.1车间调度问题建模1.1.2仿真技术在车间调度问题中的应用1.1.3车间调度问题的传统解决算法1.2强化学习问题1.2.1基本概念与定义1.2.2
深度强化学习
Ctrl+Alt+L
·
2023-02-01 07:23
论文笔记
人工智能
深度学习
深度强化学习
调度研究的心路历程
文章目录萌芽开题闭关学习研究源码环境搭建第一篇论文-[基于
深度强化学习
的模糊作业车间调度问题研究](https://blog.csdn.net/hba646333407/article/details/
松间沙路hba
·
2023-02-01 07:53
车间调度
深度强化学习
车间调度
强化学习
【从RL到DRL】
深度强化学习
基础(三)——蒙特卡洛算法、TD算法改进:经验回放与高估问题的优化——Target网络与Double DQN,DQN结构改进——Dueling网络
目录蒙特卡洛算法(MonteCarloAlgorithms)例子:近似计算π例子二:蒙特卡洛方法在定积分中的应用:应用:蒙特卡洛近似期望(Expectation)ExperienceReplay经验回放DQN与TD算法回顾经验回放改进:PrioritizedExperienceReplay优先经验回放高估问题Bootstrapping高估问题(ProblemofOverextimation)解决方
Vulcan_Q
·
2023-02-01 07:52
RL到DRL
算法
网络
人工智能
两种
深度强化学习
算法在网络调度上的应用与优化(DQN A3C)
首先给出论文地址和代码,ReinforcementLearningBasedSchedulingAlgorithmforOptimizingAgeofInformationinUltraReliableLowLatencyNetworks从题目可以得知,这是一篇有关强化学习的论文,具体的工作是用A3C算法来优化10个sensor的AOI以及保证URLLC,所谓URLLC,即给每一个sensor都设
DongXun_Lord
·
2023-02-01 07:49
强化学习
算法
机器学习
神经网络
【
深度强化学习
】深度Q网络DQN
[
深度强化学习
]DQNDQN是将深度学习和强化学习结合起来而实现从感知到动作的端对端的全新算法。深度Q学习的核心就是用一个人工神经网络q(s,a;θ),s∈S,a∈A来代替动作价值函数。
菜鸟 果果
·
2023-02-01 00:19
网络
深度学习
14. 深度Q网络
深度Q网络14.1用
深度强化学习
玩雅达利14.1.1介绍14.1.2背景14.1.3相关工作14.1.4
深度强化学习
1.预处理和模型架构14.1.5实验14.2通过
深度强化学习
进行的人级控制14.2.1
少时诵诗书-
·
2023-02-01 00:16
强化学习与多智能体
网络
深度学习
人工智能
Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning翻译
摘要本文提出一种由顺序性跟踪动作控制的新颖跟踪器,该控制方法是从
深度强化学习
中学习到的。
梨落琴川
·
2023-01-31 12:01
深度学习论文学习笔记
强化学习
监督学习
动作决策
dagnn
掌握
深度强化学习
第一章 -- 什么是
深度强化学习
什么是强化学习强化学习是机器学习的一个分支,主要是为了解决当条件变化时如何自动学习并作出最优决策的问题。这个问题在科研和工程领域都广泛存在。在我们这个世界一直都在变化,很多看似静态的输入输出的问题随着时间的推移都在动态变化。比如,你想用卷积神经网络训练一个模型,用来将图片分类成猫或者狗。一开始你的程序工作完美,能够又快又准的区分出图片。你觉得一切都很完美,于是,出去度了个假,结果当你回来的时候,宠
神奇博士
·
2023-01-31 10:50
2022年度强化学习领域19个重要进展汇总
本文整理自“
深度强化学习
实验室”公众号,阅读原文请点击这里。
u013250861
·
2023-01-31 09:38
强化学习
人工智能
深度学习
商简智能学术成果|基于
深度强化学习
的联想电脑制造调度(Lenovo Schedules Laptop Manufacturing Using Deep Reinforcement Learning)
文章目录摘要背景介绍传统方法无法解决现有挑战解决方案提升模型表达能力针对复杂约束的掩码机制快速模型训练配置多目标调度优化结论 本篇论文作为商简智能的最新研究成果,发表于运筹学顶刊《INFORMSJOURNALONAPPLIEDANALYTICS》,首次将
深度强化学习
落地于大规模制造调度场景
松间沙路hba
·
2023-01-30 22:25
车间调度
深度强化学习
深度强化学习
联想
产线调度
自动驾驶前沿综述:基于
深度强化学习
的自动驾驶算法
©作者|陈道明学校|布里斯托尔大学研究方向|自动驾驶方向这是21年的一篇综述文章,可以算得上是最前沿的自动驾驶技术综述。这几年随着深度表征学习的发展,强化学习领域也得到了加强。本文会对目前最先进的自动驾驶DRL算法进行汇总和分类。论文标题:DeepReinforcementLearningforAutonomousDriving:ASurvey论文链接:https://arxiv.org/abs/
PaperWeekly
·
2023-01-30 10:09
算法
机器学习
人工智能
深度学习
计算机视觉
Tensorflow学习笔记十一——
深度强化学习
11.2
深度强化学习
的思路大体上可以认为强化学习原语1956年Bellman提出的动态规划方法1977年Werbos在此基础上提出了自适应的动态规划方法1989年Watkins提出了Q(状态-动作值函数
谢欣燕
·
2023-01-29 11:29
笔记
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他