E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
ReinForcement
强化学习、增强学习、RL、
Reinforcement
Learning、无监督学习 by 研三笔记
目录笔者的话分类一些重要的概念Qlearning和saras区别先抽象再具体再抽象分类概念笔者的话学不会,趁早放弃吧!开个小玩笑,哈哈。弄懂,优缺点、特点、研究对象、应用对象、分类、基本原理、应用举例。分类看书先看目录,这个是奇迹重要的!学东西也一样,掌握一样东西的分类是非常非常重要的!能够加深对整体框架的理解。还不多说,且听老夫娓娓道来。强化学习算法按照agent分类,可以分为下面几类:关注最优
干了这碗汤
·
2022-11-10 07:02
综合
人工智能
算法
求解车辆路径问题的强化学习方法
1文章信息《
Reinforcement
LearningforSolvingtheVehicleRoutingProblem》是32ndConferenceonNeuralInformationProcessingSystems
当交通遇上机器学习
·
2022-11-09 12:03
算法
大数据
python
神经网络
机器学习
多后端深度学习开发框架TensorlayerX发布
国内启智平台:TensorLayerX或GitHub开源地址:GitHub-tensorlayer/TensorLayerX:TensorLayerX:AUnifiedDeepLearningand
Reinforcement
LearningFrameworkforAllHardwares
Quantumliu
·
2022-11-08 01:41
人工智能
深度学习
pytorch
tensorflow
paddlepaddle
机器学习算法(三十):强化学习(
Reinforcement
Learning)
目录1简介1.1什么是强化学习1.2强化学习的主要特点1.3强化学习的组成部分2强化学习训练过程3强化学习算法归类3.1ValueBased3.2PolicyBased3.3Actor-Critic3.4其他分类4EE(Explore&Exploit)探索与利用5强化学习实际开展中的难点6强化学习的实际应用6.1自动驾驶6.2游戏6.3推荐系统7Q-learning8策略梯度1简介1.1什么是强化
意念回复
·
2022-11-07 08:25
机器学习算法
深度学习
机器学习
强化学习3 基于时间差分的强化学习方法
相关连接:《深入浅出强化学习-原理入门》作者知乎分享:https://zhuanlan.zhihu.com/p/25580624课本中的代码:https://github.com/gxnk/
reinforcement
-learning-code
风铃777
·
2022-11-06 13:46
python
强化学习
《深入浅出强化学习原理入门》学习笔记(三)机器人找金币应用实例
学习笔记(三)机器人找金币应用实例1、实例描述2、环境构建源码及注释3、注册环境并通过gym标准形式调用4、复现过程中遇到的问题及修改原作者代码:链接:https://github.com/gxnk/
reinforcement
-learning-code
阿姝姝姝姝姝
·
2022-11-06 13:40
python
人工智能
强化学习
机器学习
Causal Reasoning from Meta-
reinforcement
Learning(自用笔记)
Abstractnovelsituations:元强化学习框架,agent在新环境下能够有效Theagentcanselectinformativeinterventions,drawcausalinferencesfromobservationaldata,andmakecounterfactualpredictions.新的探索策略:structuredexploration,providin
卉卉卉大爷
·
2022-11-04 09:31
因果挖掘
强化学习
机器学习
人工智能
概率论
Interpretable Rl Summary
文章目录ModelApproximationMethodTowardInterpretableDeep
Reinforcement
LearningwithLinearModelU-Trees(2018,ECML
YAN-Xi1998
·
2022-11-03 18:46
Reinforcement
Learning
机器学习
算法
你的深度强化学习第一本书!
2020年6月由Springer发行《Deep
Reinforcement
Lea
AIerHub
·
2022-11-01 14:04
Transfer in Deep
Reinforcement
Learning using Knowledge Graphs
摘要在文本冒险游戏中,玩家必须通过文本描述来理解游戏世界,并通过文本描述来声明行动,这为语言行动奠定了基础。之前的工作已经证明,使用知识图作为状态表示和问题回答来预先训练深度q网络有助于更快的控制策略学习。在本文中,我们探索使用知识图作为领域知识转移的表示,用于训练文本冒险游戏强化学习代理。我们的方法在多个计算机生成和人类编写的不同领域和复杂性的游戏中进行了测试,并表明我们的迁移学习方法让我们更快
小蜗子
·
2022-10-31 11:41
强化学习
游戏
知识图谱
神经网络
自然语言处理
Efficient Text-based
Reinforcement
Learning by Jointly LeveragingState and Commonsense Graph Repres
摘要基于文本的游戏(TBGs)已经成为评估基础语言理解和强化学习(RL)交叉阶段进展的有用基准。最近的工作提出了使用外部知识来提高TBG的RL制剂的效率。在本文中,我们假设为了在TBG中有效地行动,代理必须能够在检索和使用相关常识知识的同时跟踪游戏的状态。因此,我们为TBG提出了一个代理,它可以诱导游戏状态的图形表示,并将其与来自ConceptNet的常识知识图形结合起来。这种结合是通过两个符号表
小蜗子
·
2022-10-31 11:41
强化学习
游戏
人工智能
MindSpore
Reinforcement
新特性:分布式训练和蒙特卡洛树搜索
MindSpore
Reinforcement
MindSpore
Reinforcement
v0.5版本提供了基于DataflowFragment的分布式训练能力,通过扩展新的Fragment可以实现灵活的分布式训练策略
昇思MindSpore
·
2022-10-30 12:40
技术博客
分布式
python
机器学习
Reinforcement
learning-强化学习基础
1.基本定义RL与有监督学习、无监督学习的比较:(1)有监督的学习是从一个已经标记的训练集中进行学习,训练集中每一个样本的特征可以视为是对该situation的描述,而其label可以视为是应该执行的正确的action,但是有监督的学习不能学习交互的情景,因为在交互的问题中获得期望行为的样例是非常不实际的,agent只能从自己的经历(experience)中进行学习,而experience中采取的
pinn山里娃
·
2022-10-29 07:13
强化学习
人工智能
机器学习
深度学习
[经典论文分享] Decision Transformer:
Reinforcement
Learning via Sequence Modeling
1背景无聊时看群聊发现在半年前2021年7月左右新出了一个方法,叫做decisiontransformer。一直以来都是对attention机制大家族保持着崇高的敬意,于是找到了这篇文章看了一下。看完之后感觉并不是很惊喜,也可能是期待太高。文章核心做的工作是给出了一种新的深度强化学习训练模式,使得能够更加‘端对端’地去用transformer大家族去拟合和训练。截止2022年1月22日,这篇文章在
普通攻击往后拉
·
2022-10-27 18:34
RL-based文献阅读
神经网络基础模型关键点
transformer
深度学习
强化学习
昇思MindSpore全场景AI框架 1.6版本,更高的开发效率,更好地服务开发者!
与此同时,昇思MindSpore全场景AI框架发布高效易用的图学习框架昇思MindSporeGraphLearning,高性能可扩展的强化学习计算框架昇思MindSpore
Reinforcement
,提供支持第三方框架模型迁移工具
昇思MindSpore
·
2022-10-25 07:23
技术博客
人工智能
强化学习: 贝尔曼方程与马尔可夫决策过程
常用的资料:《
Reinforcement
Learning:AnIntroduction》author:RichardS.Suttonan
c-minus
·
2022-10-23 17:44
强化学习
强化学习
贝尔曼方程
马尔可夫决策过程
人工智能
算法
为什么说强化学习是一种人工智能的通用框架?
深度强化学习(Deep
Reinforcement
Learning),强化学习是一种人工智能的通用框架:1、强化学习是针对一个拥有行动能力的agent而言的2、每个行动影响了agent的未来状态3、使用标量值回报信号来度量成功一言以蔽之
shenmanli
·
2022-10-23 07:23
技术知识
函数
人工智能
框架
信息处理
Coding and Paper Letter(四十八)
reinforcement
learning2.网页上基于LaTex的数学公式js库。KaTex3.通过分组极端点和中心点进行自下而上的物体检测。ExtremeNet4.用于场景分割的双重注意力网络。
weixin_34416754
·
2022-10-22 07:19
(转)简单强化Q-learning的Python实现
(转)简单强化Q-learning的Python实现强化学习(
reinforcement
learning),又称再励学习、评价学习,是一种重要的机器学习方法,强化学习是智能体(Agent)以“试错”的方式进行学习
纵心似水
·
2022-10-19 07:14
强化学习
机器学习
python
人工智能基础:机器学习常见的算法介绍
目录监督学习1.1分类1.2回归无监督学习2.1聚类2.2降维3、半监督学习4、迁移学习5、强化学习(
Reinforcement
Learning,RL)今天给大家聊聊机器学习算法相关的知识,一起来看看吧
IT技术分享社区
·
2022-10-18 07:55
人工智能
机器学习
算法
人工智能
python
自然语言处理
你的深度强化学习第一本书!
2020年6月由Springer发行《Deep
Reinforcement
Lea
·
2022-10-17 17:49
人工智能
Drones Chasing Drones:
Reinforcement
Learning and Deep Search Area Proposal(无人机追逐无人机:强化学习和深度搜索区域建议)
DronesChasingDrones:
Reinforcement
LearningandDeepSearchAreaProposalAbstract:1.Introduction2.ProposedFramework
BQTᯤ
·
2022-10-17 07:43
无人机
自动驾驶
深度学习
机器学习
机器学习开篇之机器学习的分类
目录1引言2机器学习分类2.1监督学习(SupervisedLearning)2.1.1传统监督学习2.1.2非监督学习2.1.3半监督学习2.1.4其它分类2.2强化学习(
Reinforcement
Learning
Lion丶Dream
·
2022-10-12 22:54
机器学习
分类
人工智能
机器学习
深度学习
【论文阅读】Does Neuron Coverage Matter for Deep
Reinforcement
Learning?: A Preliminary Study.
文章目录一.论文信息二.论文结构三.论文内容Abstract摘要四.参考资料一.论文信息论文题目:DoesNeuronCoverageMatterforDeep
Reinforcement
Learning
Allenpandas
·
2022-10-10 20:01
科研专区
论文阅读
人工智能
强化学习
测试覆盖率
覆盖率分析
【论文阅读】Robustness and performance of Deep
Reinforcement
Learning.
文章目录一.论文信息二.论文结构三.论文内容Abstract摘要一.论文信息题目:RobustnessandperformanceofDeep
Reinforcement
Learning.
Allenpandas
·
2022-10-10 20:00
科研专区
论文阅读
人工智能
深度学习
强化学习
遗传算法
RL 实践(2)—— 杰克租车问题【策略迭代 & 价值迭代】
参考:《
Reinforcement
LearningAnIntroduction》——RichardS.Sutton完整代码下载:[HandcraftEnv]Jack’sCarRental(PolicyIteration
云端FFF
·
2022-10-10 19:46
#
强化学习
#
实践
策略迭代
价值迭代
杰克租车问题
强化学习
强化学习DQN、DDQN和Dueling DQN的原理介绍与PARL核心代码解析
DQN:Human-levelControlThroughDeep
Reinforcement
LearningDDQN:DeepReinforce
秋水中的鱼
·
2022-10-10 07:13
神经网络
深度学习
python
Ubuntu下常用强化学习实验环境搭建(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)
aimachinelearning/68113原文地址:http://blog.csdn.net/jinzhuojun/article/details/77144590和其它的机器学习方向一样,强化学习(
Reinforcement
Learning
weixin_30367873
·
2022-09-30 07:54
DL--常用增强学习实验环境 I (MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)
原文地址:http://blog.csdn.net/jinzhuojun/article/details/77144590和其它的机器学习方向一样,强化学习(
Reinforcement
Learning)
born-in-freedom
·
2022-09-30 07:08
深度强化学习
常用增强学习实验环境
强化学习实验环境 I (MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)
转载:http://blog.csdn.net/jinzhuojun/article/details/77144590和其它的机器学习方向一样,强化学习(
Reinforcement
Learning)也有一些经典的实验场景
AITBOOK
·
2022-09-30 07:08
强化学习
强化学习笔记
强化学习
强化学习纲要(周博磊)
强化学习纲要主要内容强化学习纲要一、概括与基础1.什么是强化学习2.Differencebetween
Reinforcement
LearningandSupervisedLearning3.Featuresof
Reinforcement
Learning4
Highlight_Jin
·
2022-09-27 07:04
ICLR 2022 主题论文推荐——
Reinforcement
Learning
ICLR,即国际表征学习大会,由位列深度学习三大巨头之二的YoshuaBengio和YannLeCun牵头创办,是公认的深度学习领域国际顶级会议之一,关注有关深度学习各个方面的前沿研究,在人工智能、统计和数据科学领域以及机器视觉、语音识别、文本理解等重要应用领域中发布了众多极其有影响力的论文。以下论文供大家参考学习:1.LearningStateRepresentationsviaRetracin
AMiner学术搜索和科技情报挖掘
·
2022-09-25 19:47
人工智能
ICLR2022
强化学习
机器学习中的名词释义(一)
DeepLearning)监督学习——SupervisedLearning无监督学习——UnsupervisedLearning半监督学习——Semi-supervisedLearning强化学习——
Reinforcement
Learning
繁华三千东流水
·
2022-09-23 18:53
机器学习算法思想及代码实现
机器学习
基础名词释义
DQN及其变种(Double DQN,优先回放,Dueling DQN)
1.DQN1.1DQN的三大特点DQN由DeepMind在2013年发表的文章《PlayingAtariwithDeep
Reinforcement
Learning》提出,文章有两个创新点:经验回放和设立单独的目标网络
bujbujbiu
·
2022-09-21 17:22
深度强化学习
神经网络
深度学习
强化学习
[文献精读] End-to-End Model-Free
Reinforcement
Learning for Urban Driving using Implicit Affordances
End-to-EndModel-Free
Reinforcement
LearningforUrbanDrivingusingImplicitAfforda思维导图摘要1引言2相关工作2.1用RL实现端对端无人驾驶
蛋总的快乐生活
·
2022-09-19 11:04
CARLA
文献精度
算法
强化学习
【论文阅读】Deep
Reinforcement
Learning from Self-Play in Imperfect-Information Games
【论文阅读】Deep
Reinforcement
LearningfromSelf-PlayinImperfect-InformationGames博弈论基础AbstractIntroductionBackgroundRLExtensive-FormGamesFSPNFSP
博弈真的不简单啊
·
2022-09-11 07:40
机器博弈
非完美信息博弈
强化学习
自博弈
【
Reinforcement
Learning】actor-critic学习
强化学习最主要的两种方式的融合,actor-critic的究竟是怎么回事?此处笔记根据B站课程,王树森老师的强化学习记录而来。4.深度强化学习(4_5):Actor-CriticMethods(Av374239425,P4)_哔哩哔哩_bilibili1.Actor-criticMethods:同时训练策略网络和价值网络Actor动作学习网络,看作是一个运动员,不断地做出动作,根据裁判的打分逐渐做
庄园特聘拆椅狂魔
·
2022-09-02 07:49
强化学习
学习
强化学习
论文研读-Deep Multi-Agent
Reinforcement
Learning-2
深度多智能体强化学习(DMARL)此篇文章为博士学位论文:DeepMulti-Agent
Reinforcement
Learning的论文学习笔记,只供学习使用,不作商业用途,侵权删除。
小王爱学习1234
·
2022-08-31 07:50
多智能体深度强化学习
强化学习
论文研读笔记(五)——通过单机器人进化策略搜索增强多机器人导航的深度强化学习方法
通过单机器人进化策略搜索增强多机器人导航的深度强化学习方法(EnhancingDeep
Reinforcement
LearningApproachesforMulti-RobotNavigationViaSingle-RobotEvolutionaryPolicySearch
小王爱学习1234
·
2022-08-31 07:10
编队控制
强化学习方法
多智能体深度强化学习
机器人
人工智能
机器学习
论文研读笔记(一)——多智能体强化学习的相对分布编队和避障
RelativeDistributedFormationandObstacleAvoidancewithMulti-Agent
Reinforcement
Learning(多智能体强化学习的相对分布编队和避障
小王爱学习1234443
·
2022-08-30 07:42
多智能体深度强化学习
强化学习基础
人工智能
深度学习
机器学习
论文研读笔记(二)——通过深度强化学习避免碰撞的编队控制
通过深度强化学习避免碰撞的编队控制(FormationControlwithCollisionAvoidancethroughDeep
Reinforcement
Learning)文献链接最近我在学习多机器人编队导航的论文
小王爱学习1234443
·
2022-08-30 07:42
多智能体深度强化学习
编队控制
强化学习基础
深度学习
人工智能
自动驾驶
论文研读——基于深度强化学习的自动驾驶汽车运动规划研究综述
论文研读——SurveyofDeep
Reinforcement
LearningforMotionPlanningofAutonomousVehicles此篇文章为论文的学习笔记,只供学习使用,不作商业用途
小王爱学习1234443
·
2022-08-30 07:11
多智能体深度强化学习
自动驾驶
人工智能
机器学习
论文研读笔记(三)——基于障碍函数的移动机器人编队控制安全强化学习
基于障碍函数的移动机器人编队控制安全强化学习(BarrierFunction-basedSafe
Reinforcement
LearningforFormationControlofMobileRobots
小王爱学习1234443
·
2022-08-30 07:55
编队控制
强化学习方法
人工智能
深度学习
计算机视觉
强化学习:资料整理
强化学习(英語:
Reinforcement
learning,簡稱RL)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益[1]。
FL17171314
·
2022-08-19 18:45
算法
机器学习
人工智能
Text to SQL 论文汇总(NL2SQL/TableQA)
Seq2sql:Generatingstructuredqueriesfromnaturallanguageusing
reinforcement
learning会议:CoRR2017.作者:VictorZhong
阿_牛
·
2022-08-16 07:09
对话机器人
text2sql
nl2sql
tableqa
paper
论文
论文笔记 Reinforced Feature Points: Optimizing Feature Detection and Description for a High-Level Task
代码解读介绍\quad文章的主要思路是使用SuperPint的预训练模型,使用旋转矩阵RRR和平移矩阵ttt对SuperPoint进行
reinforcement
learning,使其能够估计相机的相对位姿变化
爱嘤嘤的小猪仔
·
2022-08-12 07:38
计算机视觉
深度学习
计算机视觉
自动驾驶
【论文笔记】Combining
Reinforcement
Learning and Rule-based Method to Manipulate Objects in Clutter
Combining
Reinforcement
LearningandRule-basedMethodtoManipulateObjectsinClutter文章目录**Combining
Reinforcement
LearningandRule-basedMethodtoManipulateObjectsinClutter
Ctrl+Alt+L
·
2022-08-12 07:01
论文笔记
机器学习
目标检测
多Agent 深度强化学习综述
多Agent深度强化学习综述人工智能技术与咨询来源:《自动化学报》,作者梁星星等摘要近年来,深度强化学习(Deep
reinforcement
learning,DRL)在诸多复杂序贯决策问题中取得巨大突破
m0_62870606
·
2022-08-05 07:23
人工智能
深度学习
神经网络
“知识图谱+”系列:知识图谱+强化学习
1知识图谱推理DeepPath:A
Reinforcement
LearningMethodforKnowledgeGraphReasoni
ngl567
·
2022-07-27 07:44
人工智能遇上知识图谱
人工智能
自然语言处理
知识图谱
机器学习
强化学习
Tomcat Server Configuration Automation
Reinforcement
目录0.引言1.黑客针对WEBServer会有那些攻击面2.针对TomcatServer可以做的安全加固3.ManagingSecurityRealmswithJMX4.实现对TOMCAT配置信息的动态修改(hotdynamicedit)5.Tomcatmanager弱口令入侵部署WEBSHELL防御6.Tomcat远程war包部署攻防0.引言mostweaknessesinApacheTomca
weixin_30326745
·
2022-07-26 10:43
java
web.xml
php
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他