E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多智能体深度强化学习
MECC:一种基于
深度强化学习
的移动边缘协作缓存框架
MECC:AMobileEdgeCollaborativeCachingFrameworkEmpoweredbyDeepReinforcementLearning文章目录摘要RelatedworksUser-behavior-awarecontentcachingCollaborativeedgecachingMobileedgecollaborativecachIngframeworkFL-ba
sc0024
·
2022-11-25 09:15
缓存
多智能体
强化学习的前世今生
最近在学习
多智能体
的强化学习,看了几篇高质量基础论文,发现还是很有必要将强化学习的体系简单过一遍,然后再有针对性地练习代码。
kaohoooo
·
2022-11-25 08:04
强化学习
python
机器学习
论文阅读|Nash Q-Learning for General-Sum Stochastic Games基于强化学习的
多智能体
研究(附代码)
论文:NashQ-learningforgeneral-sumstochasticgames链接:http://www.jmlr.org/papers/volume4/hu03a/hu03a.pdfAbstract:WeextendQ-learningtoanoncooperativemultiagentcontext,usingtheframeworkofgeneral-sumstochasti
kaohoooo
·
2022-11-25 08:03
论文阅读
论文阅读
python
机器学习
物流行业的任务分配&协同调度问题研究
多智能体
的
kaohoooo
·
2022-11-25 08:22
物流
算法
前沿技术讲习班学习笔记1-邱锡鹏老师
大纲:(1)概述:机器学习概述、感知器、应用(2)基础模型:前馈神经网络、卷积神经网络、循环神经网络、网络正则化与优化、应用(3)进阶模型:注意力机制与外部记忆、无监督学习、概率图模型、深度生成模型、
深度强化学习
Javier9201
·
2022-11-24 17:00
人工智能
数据结构与算法
大数据
深度强化学习
让AI 实现真正的“智能”,附Atari 2600 Video Pinball数据集下载资源
人脸识别、无人驾驶、智能推荐……这期咱们就来聊一聊人工智能任务类型和你可能想不到的
深度强化学习
。一、人工智能任务分类人工智能任务类型可分为预测型、决策型2个大类。
OpenDataLab
·
2022-11-24 15:12
公开数据集下载
深度强化学习
人工智能
深度学习
机器学习
ubuntu 18.04.5中flow, smarts & xingtian
多智能体
RL环境构建
ubuntu18.04.5中flow,smarts&xingtian
多智能体
RL环境构建Flow虚拟环境构建由于需要在同一个主机上运行多个环境,不同的环境具有不同的依赖包。
Jimmy-TONG
·
2022-11-24 15:42
科技
linux
人工智能
强化学习
自动驾驶
谈起AlphaGo,来看其中的强化学习知识点
谈起AlphaGo来看其中的强化学习知识点王树森老师的
深度强化学习
课程笔记1.TrainingandExecution1.1.trainingin3steps:首先,利用behaviorcloning模仿学习
Catherine_he_ye
·
2022-11-24 15:04
RL
深度学习
人工智能
异构系统中的UUV、异构系统模型统一化及单应矩阵在异构系统中的应用
异构系统中的UUV、异构系统模型统一化及单应矩阵在异构系统中的应用UUV发展趋势及关键技术异构编队系统编队异构系统模型统一化单应矩阵在异构系统中的应用UUV发展趋势及关键技术上一篇
多智能体
系统的发展、系统评价及部分文章方法中
ADi_hhh
·
2022-11-24 13:36
异构多智能
矩阵
无人机
机器人
论文阅读
车道标记检测中的深度学习:综述(Deep Learning in Lane Marking Detection: A Survey)
深度强化学习
是深度学
Wincher_Fan
·
2022-11-24 12:51
车道线检测/道路边缘检测
计算机视觉
人工智能
深度学习
算法
机器学习
Talk | 清华大学陈晓宇&苏黎世联邦理工黄嘉伟 :基于实际应用的强化学习
他们与大家分享的主题是:“基于实际应用的强化学习”,届时将分别讲解一种针对分段平稳环境的自适应
深度强化学习
方法,以及等级强化学习:悲观面对风险与常数regre
TechBeat人工智能社区
·
2022-11-24 12:13
每周Talk上架
强化学习
强化学习 | 基于Novelty-Pursuit的高效探索方法
深度强化学习
实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/Li,Ziniu,andXiong-HuiChen.
深度强化学习实验室
·
2022-11-24 11:49
算法
强化学习
人工智能
深度学习
机器学习
第6章 循环神经网络
章前馈神经网络第5章卷积神经网络第6章循环神经网络第7章网络优化与正则化第8章注意力机制与外部记忆第9章无监督学习第10章模型独立的学习方式第11章概率图模型第12章深度信念网络第13章深度生成模型第14章
深度强化学习
第
zaiziwamei
·
2022-11-24 07:03
神经网路和深度学习
rnn
人工智能
MATLAB代码:基于
多智能体
系统一致性算法的电力系统分布式经济调度策略
MATLAB代码:基于
多智能体
系统一致性算法的电力系统分布式经济调度策略关键词:一致性算法
多智能体
分布式调度仿真平台:MATLAB平台参考文档:中文复现,效果非常好,想看文献和运行效果加好友主要内容:代码主要做的是电力系统的分布式调度策略
「已注销」
·
2022-11-24 01:19
程序人生
Wei Yang Bryan Lim, etc. Federated Learning in Mobile Edge Networks: A Comprehensive Survey.
FL)、ML、MECBAA(宽带模拟聚合)、CNN(卷积神经网络)、CV(计算机视觉)、DDQN(双深度Q网络)、DL(深度学习)DNN(深度神经网络)、DP(差分隐私)、DQL(深度Q学习)、DRL(
深度强化学习
彭于晏程序分晏
·
2022-11-24 00:56
联合学习
万字专栏总结 | 离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等)...
离线强化学习(OfflineRL)作为
深度强化学习
的子领域,其不需要与模拟环境进行交互就可以直接从数据中学习一套策略来完成相关任务,被认为是强化学习落地的重要技术之一。本文详细的阐
数据派THU
·
2022-11-24 00:49
算法
大数据
强化学习
python
机器学习
(论文分析)边缘计算中基于
深度强化学习
的卸载博弈
论文题目:ADeepReinforcementLearningBasedOffloadingGameinEdgeComputing研究内容:利用基于策略梯度的
深度强化学习
设计分布式计算卸载算法,在用户网络带宽以及偏好信息不公开情况下如何设计一种有效的卸载策略来决定哪些任务可以卸载到资源有限的边缘服务器
qq_45948088
·
2022-11-24 00:18
计算卸载
边缘计算
算法
(论文分析)基于
深度强化学习
方法的有效边缘学习激励机制设计
论文题目:AnIncentiveMechanismDesignforEfficientEdgeLearningbyDeepReinforcementLearningApproach(INFOCOM2020论文)研究目的:提高边缘学习的学习效率,解决动态确定定价策略以最小化边缘学习开销的问题。针对问题:如何在网络边缘设计激励机制实现有效的边缘学习解决方案:研究了一种分布式ML方案,即边缘学习,其中训
qq_45948088
·
2022-11-24 00:47
学习
深度学习
网络
边缘计算
【万字专栏总结】离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等)...
本文来源自知乎博客,作者:旺仔搬砖记,排版:OpenDeepRL由于内容过长,本文仅展示部分内容,完整系列博客请文末阅读原文离线强化学习(OfflineRL)作为
深度强化学习
的子领域,其不需要与模拟环境进行交互就可以直接从数据中学习一套策略来完成相关任务
风度78
·
2022-11-23 23:39
算法
大数据
强化学习
python
神经网络
第1期技术: DQN算法原理及实现过程
深度强化学习
实验室(DeepRLhub)访问官网:http://deeprlhub.com特别声明:本文是作者在充分知晓著作权细则的情况下,经过个人付出或者翻译他人著作内容,并已注明翻译原文来源的情况下授权给
深度强化学习实验室
·
2022-11-23 22:05
《实验室》技术文章汇总
深度学习
机器学习
近端策略优化(proximal policy optimization)算法简述
本文通过整理李宏毅老师的机器学习教程的内容,简要介绍
深度强化学习
(deepreinforcementlearning)中的近端策略优化算法(proximalpolicyoptimization)。
星海浮生
·
2022-11-23 22:04
机器学习
深度强化学习
算法
机器学习
概率论
actor-critic 相关算法简述
本文通过整理李宏毅老师的机器学习教程的内容,简要介绍
深度强化学习
(deepreinforcementlearning)中基于actor-critic的相关算法。
星海浮生
·
2022-11-23 22:04
机器学习
深度强化学习
算法
人工智能
深度学习
策略梯度法(policy gradient)算法简述
本文通过整理李宏毅老师的机器学习教程的内容,简要介绍
深度强化学习
(deepreinforcementlearning)中的策略梯度法(policygradient)。
星海浮生
·
2022-11-23 22:33
机器学习
深度强化学习
机器学习
深度学习
概率论
DQN(deep Q-network)算法简述
本文通过整理李宏毅老师的机器学习教程的内容,简要介绍
深度强化学习
(deepreinforcementlearning)中的DQN(deepQ-network)算法。
星海浮生
·
2022-11-23 22:32
机器学习
深度强化学习
算法
深度学习
人工智能
【论文笔记】基于
深度强化学习
的机器人操作行为研究综述
强化学习算法原理2.2.2强化学习算法分类1.无模型(model-free)算法和基于模型(model-based)的算法2.基于价值(value-based)的算法和基于策略(policy-based)的算法3
深度强化学习
Ctrl+Alt+L
·
2022-11-23 22:52
论文笔记
深度学习
神经网络
人工智能
100篇文献-万字总结 || 强化学习求解车间调度
文章目录状态动作奖励探索和利用结论参考文献近年来强化学习和
深度强化学习
不断用于求解调度问题,其是在动态调度问题上,它们可以根据不同的调度状态获得自适应的调度策略,在遇到新的问题时,只需要输入新的调度特征就可以快速获得调度解
松间沙路hba
·
2022-11-23 22:51
智能制造
车间调度
强化学习
强化学习
车间调度
《强化学习周刊》第39期:近似最优深度、
多智能体
广义、角色动画强化学习...
No.39智源社区强化学习组强化学习研究观点资源活动周刊订阅告诉大家一个好消息,《强化学习周刊》已经开启“订阅功能”,以后我们会向您自动推送最新版的《强化学习周刊》。订阅方法:方式1:扫描下面二维码,进入《强化学习周刊》主页,选择“关注TA”便完成订阅。方式2:点击本文下方的“阅读原文”,进入《强化学习周刊》Hub社区版,根据内附的详细订阅步骤,完成订阅。关于周刊强化学习作为人工智能领域研究热点之
智源社区
·
2022-11-23 22:19
算法
神经网络
大数据
编程语言
机器学习
《强化学习周刊》第39期:近似最优深度、
多智能体
广义、角色动画强化学习
论文推荐强化学习近年来取得了令人瞩目的成就,其应用于各个领域的研究也取得较大的进步,比如势场增强强化学习、
多智能体
AMiner学术搜索和科技情报挖掘
·
2022-11-23 22:18
AMiner论文推荐
人工智能
基于
多智能体
强化学习的自主移动机器人实时订单调度
原文:Real-timeorderdispatchingforafleetofautonomousmobilerobotsusingmulti-agentreinforcementlearning(2020)摘要自主移动机器人(AMRs)越来越多地被用于动态生产环境中实现高效的物料流动。由于环境的快速变化带来的复杂性,以及调度、路径规划和路径执行之间的紧密耦合,在这样的环境中调度运输订单非常困难。
C_h_o_o
·
2022-11-23 22:17
AGV-仓储
人工智能
基于图注意力神经网络的
多智能体
博弈抽象
G2ANet《Multi-AgentGameAbstractionviaGraphAttentionNeuralNetwork》关键词:大规模,博弈抽象,2级(硬+软皆有)注意力机制,图神经网络通过简化策略学习过程解决了大规模智能体的问题。贡献1.用完全图来建模(构建)智能体之间的关系。因为大规模的智能体场景中不是每个智能体都相互作用的,我们需要确定关系(交互还是不交互?),就像足球后卫后卫不需要
溪云初起,山雨欲来
·
2022-11-23 19:54
人工智能/强化学习
机器学习
人工智能
深度学习
多智能体
强化学习论文——G2ANet(AAAI 2020)
存在的问题&研究动机&研究思路大规模
多智能体
的博弈关系复杂,导致了策略学习困难。因此,简化学习过程是重要的研究点。
条件反射104
·
2022-11-23 19:24
多智能体强化学习
算法
深度学习
强化学习
多智能体
强化学习-DGN
DGN:GraphConvolutionalReinforencementLearning论文地址代码地址代码(修正)摘要论文主要讨论协作的
多智能体
在部分可观测的场景下通过通信来最大化
多智能体
系统共同的效用函数
大鱼治不了水
·
2022-11-23 19:52
多智能体强化学习
深度学习
计算机视觉
神经网络
多智能体
强化学习-MAAC
引入注意力机制的actor-critic强化学习论文链接:https://arxiv.org/pdf/1810.02912.pdf代码链接:https://github.com/shariqiqbal2810/MAAC摘要本文主要思想是学习一个具有注意力机制的集中式critic。(CTDE方法中,训练时拥有上帝视角,提高学习效率,通过从所有智能体那里获得的消息进行集中学习critic,执行时各自独
大鱼治不了水
·
2022-11-23 19:21
多智能体强化学习
人工智能
强化学习
MPE环境安装-强化学习的小demo
的前世今生MPE安装准备工作环境配置开始安装测试关于如何将你的虚拟环境和pycharm统一MPE的前世今生MPE(Multi-AgentParticleEnvironment)是由OpenAI开源的一款
多智能体
强化学习实验平台
大鱼治不了水
·
2022-11-23 19:51
技能学习中
python
pycharm
git
多智能体
强化学习-G2ANet
本文将这种检测机制集成到基于图神经网络的
多智能体
强化学习中,以进行游戏抽象(可以理解为为了提高智能体的性能,简化
大鱼治不了水
·
2022-11-23 19:50
多智能体强化学习
人工智能
算法
第二届腾讯“开悟”大赛初赛放榜,强化学习研究还能这么快乐
本文将介绍第二届腾讯「开悟」
多智能体
强化学习大赛初赛晋级名单及参赛团队情况。一场发生在王者峡谷的赛事,背后竟然是清华、北大、中科大、电子科技大学……等20多所名校的学生和老师?
腾讯AI实验室
·
2022-11-23 14:02
游戏
算法
人工智能
大数据
编程语言
第二届「开悟」大赛结果公布,联动高校破局AI研究挑战
本文将公布第二届「腾讯开悟
多智能体
强化学习大赛」决赛成果。腾讯正在联动高校,利用王者荣耀的复杂环境,为推动通用人工智能研究创造各种可能性。
腾讯AI实验室
·
2022-11-23 14:02
腾讯
算法
游戏
大数据
人工智能
第三届腾讯「开悟」大赛启动,利用游戏复杂环境提升AI研究能力
8月18日,腾讯宣布第三届「腾讯开悟
多智能体
强化学习大赛」(下称「大赛」)正式启动。
腾讯AI实验室
·
2022-11-23 14:02
腾讯
游戏
大数据
机器学习
人工智能
腾讯AI Lab「王者绝悟」亮相世界人工智能大会,展现「AI+游戏」全新可能
“王者绝悟”与职业电竞选手展开了一场精彩的表演赛,展示了腾讯在
多智能体
博弈等前沿AI课题上的先进研究水准。腾讯公司董事会主席、首席执行官马化腾在大会上表示,“这次我们带来王
腾讯AI实验室
·
2022-11-23 14:32
游戏
人工智能
机器学习
强化学习
算法
第二届腾讯“开悟”AI大赛启动,联动高校破局研究瓶颈
8月18日,第二届“腾讯开悟MOBA
多智能体
强化学习大赛”(下称“大赛”)宣布启动。该大赛由腾讯AILab、王者荣耀、腾讯高校合作、腾讯游戏学院等共同发起,由腾讯云计算提供底层资源支持。
腾讯AI实验室
·
2022-11-23 14:32
腾讯
游戏
算法
人工智能
大数据
首届STAC科创联合大会在成都召开 “开悟” AI平台将成为行业生态基建
大会邀请了政府、企业、高校、行业专业人士到场,共话行业未来发展,聚焦探讨
多智能体
、图像识别等人工智能关键核心技术、计算机图形学(CG)、脑科学等相关交叉学科以及交通、医疗等延伸应用场景,开展新技术、新模式
腾讯AI实验室
·
2022-11-23 14:31
人工智能
腾讯
游戏
大数据
编程语言
18所名校学霸教AI打王者,「开悟」AI+游戏高校大赛启动
开悟是腾讯牵头构建的AI
多智能体
与复杂决策
腾讯AI实验室
·
2022-11-23 14:01
游戏
算法
人工智能
编程语言
大数据
深度强化学习
-Double DQN算法原理与代码
深度强化学习
-DoubleDQN算法原理与代码引言1DDQN算法简介2DDQN算法原理3DDQN算法伪代码4仿真验证引言DoubleDeepQNetwork(DDQN)是对DQN算法的改进,有效提升了算法的性能
indigo love
·
2022-11-23 12:58
深度强化学习
算法
python
人工智能
pytorch
深度学习
Ubuntu18.04搭建
深度强化学习
环境(Mujoco200 , gym)
自己记录一下DRL的环境搭建,花了一下午,不过还是基本搭建完成了.博主使用的是Ubuntu18.04+Anaconda3+cuda10.1+python3.7+tensorflow2.11.配置Mujoco-py环境和文件mujoco200的安装需要去官网申请激活码MuJoCo(Multi-JointdynamicswithContact)是一个模拟机器人,生物力学,图形和动画等领域的物理引擎。用
零壹博弈
·
2022-11-23 12:57
深度学习
深度强化学习
Ubuntu
深度学习
强化学习
人工智能
linux
cuda
深度强化学习
满足图神经网络:探索路由优化用例
摘要近年来,
深度强化学习
(DRL)在决策问题上取得了巨大的进步。因此,在自动驾驶软件定义网络中,DRL似乎有望解决许多相关的网络优化问题(如路由)。
小蜗子
·
2022-11-23 12:55
研究方向
神经网络
深度学习
人工智能
【
多智能体
强化学习】
参考链接
多智能体
深度强化学习
综述与批判.2019万字长文:详解
多智能体
强化学习的基础和应用与单智能体强化学习的区别
多智能体
强化学习的难点:环境的不稳定性:决策相互影响信息局限性:单个智能体难以获得全局信息目标一致性
Echoooooh
·
2022-11-23 12:19
深度强化学习
人工智能
用
深度强化学习
玩游戏之DQN实战笔记
用
深度强化学习
玩游戏之DQN实战笔记前言环境配置游戏环境信息提取及建模(1)血量信息提取(2)击打信息提取(3)智能体动作设置(4)奖励设置所用算法——DQN(DeepQNetwork)实际表现前言本项目基于
NathanWu7
·
2022-11-23 12:37
强化学习
深度学习
tensorflow
游戏
【
深度强化学习
环境配置】参考链接合集
解决方案1:用cpu版本的tensorflow1.8参考链接:工程配置-OpenAIMADDPG解决方案2:GPU问题:30系显卡只支持cuda11tensorflow1.15+CUDA11参考链接:linux系统在python3.6/CUDA11环境下安装tensorflow1.1530系列显卡安装tensorflow1.15实用参考:保姆级的Anaconda的基本使用教程
Echoooooh
·
2022-11-23 12:35
深度强化学习
tensorflow
python
深度学习
顶会论文 || 65篇"IJCAI"
深度强化学习
论文汇总
关注上方“深度学习技术前沿”,选择“星标公众号”,资源干货,第一时间送达!ADualReinforcementLearningFrameworkforUnsupervisedTextStyleTransfer:FuliLuo,PengLi,JieZhou,PengchengYang,BaobaoChang,XuSun,ZhifangSuiARestart-basedRank-1EvolutionS
深度学习技术前沿
·
2022-11-23 11:55
最全
深度强化学习
资料
转载J.Q.Wang2011-----
深度强化学习
系列:最全
深度强化学习
资料下面附上原地址https://blog.csdn.net/gsww404/article/details/103074046关于这项工作
LyzBlog
·
2022-11-23 11:25
强化学习
深度学习
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他