E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多智能体深度强化学习
【 ChatGPT作者LilianWeng博客总结】智能体=LLM(大语言模型)+记忆+规划技巧+工具使用...
来源:
深度强化学习
实验室 Lii’Log的博客https://lilianweng.github.io/posts/2023-06-23-agent/本文约7500字,建议阅读15分钟LLM的潜力不仅仅限于生成写得好的副本
数据派THU
·
2023-12-04 07:21
chatgpt
语言模型
python
人工智能
自然语言处理
【原文翻译】An Improved Ant Colony Optimization Algorithm for Multi-Agent Path Planning
AnImprovedAntColonyOptimizationAlgorithmforMulti-AgentPathPlanning(用于
多智能体
路径规划的改进型蚁群优化算法)文章目录AnImprovedAntColonyOptimizationAlgorithmforMulti-AgentPathPlanning
SUNX-T
·
2023-12-02 14:00
算法
算法
数据结构
【论文阅读】1 SkyChain:一个
深度强化学习
的动态区块链分片系统
SkyChain一、文献简介二、引言及重要信息2.1研究背景2.2研究目的和意义2.3文献的创新点三、研究内容3.1模型3.2自适应分类账协议3.2.1状态块创建3.2.2合并过程3.2.3拆分过程3.3评价框架3.3.1性能3.3.1.1共识延迟3.3.1.2重新分片延迟3.3.1.3处理事务数3.3.1.4约束3.3.2安全性3.3.3问题介绍四、基于DRL的动态分片框架4.1模型设计4.2训
Camina hacia ti
·
2023-12-01 20:17
论文阅读
区块链
文章解读与仿真程序复现思路——电力系统保护与控制EI\CSCD\北大核心《基于
深度强化学习
的城市配电网多级动态重构优化运行方法》
这个标题涉及到城市配电网(UrbanPowerDistributionNetwork)的优化运行方法,其中使用了
深度强化学习
(DeepReinforcementLearning)技术,并且特别强调了多级动态重构
电网论文源程序
·
2023-12-01 09:47
文章解读
重构
电网
能源
规划
配电网重构
深度强化学习
-策略梯度算法深入理解
1引言在
深度强化学习
-策略梯度算法推导博文中,采用了两种方法推导策略梯度算法,并给出了Reinforce算法的伪代码。
indigo love
·
2023-12-01 01:40
深度强化学习
算法
机器学习
强化学习
人工智能
分布式机器学习、联邦学习、
多智能体
的区别和联系——一文进行详细解释
1分布式机器学习、联邦学习、
多智能体
介绍最近这三个方面的论文都读过,这里写一篇博客归纳一下,以方便搞这几个领域的其他童鞋入门。我们先来介绍以下这三种机器学习范式的基本概念。
别出BUG求求了
·
2023-11-30 18:28
分布式
分布式
机器学习
人工智能
NeurIPS 2023 | AI Agents先行者CAMEL:首个基于大模型的
多智能体
框架
来自:PaperWeeklyAIAgents是当下大模型领域备受关注的话题,用户可以引入多个扮演不同角色的LLMAgents参与到实际的任务中,Agents之间会进行竞争和协作等多种形式的动态交互,进而产生惊人的群体智能效果。本文介绍了来自KAUST研究团队的大模型心智交互CAMEL框架(“骆驼”),CAMEL框架是最早基于ChatGPT的autonomousagents知名项目,目前已被顶级人工
zenRRan
·
2023-11-29 07:01
人工智能
耶鲁、交大提出“专家会诊”
多智能体
框架, 使用ChatGPT解决临床推理问题
近来,来自耶鲁和交大的研究者借鉴并受医院专家会诊模式的启发,提出了一个名为多学科协作(Multi-disciplinaryCollaboration,MC)的临床领域框架,目标是以无需训练、具有可解释性的方式来揭示医学智能模型的内在临床知识并提升其推理能力。论文:MEDAGENTS:LargeLanguageModelsasCollaboratorsforZero-shotMedicalReaso
zenRRan
·
2023-11-29 07:01
chatgpt
人工智能
深度学习
机器学习
<
深度强化学习
落地方法论> 笔记
Part1.需求分析DRL的过拟合天性DRL解决的是从过去经验中学习有用知识,并用于后续决策的问题。比起视觉方面的检测、识别等,决策是一个更高层的行为,所以对环境要求更为严苛,导致DRL十分依赖过拟合,并且泛化能力非常差(唯一被允许在训练集上测试的算法的称号不是盖的)。此外,由于训练过程中缺乏直接监督的信号,DRL对数据量的要求也非常巨大。所以在DRL训练中,Value函数去过拟合环境转移特性与r
什么都不太行的syq
·
2023-11-27 01:04
深度强化学习
落地方法论(4)——动作空间篇
目录前言对动作空间的三个要求完备性高效性合法性结语前言在将DRL应用于实际项目时,可能最轻松愉快的部分就是动作空间定义了。倒不是因为这项工作简单,而是agent的控制方式往往早就定死了,留给我们发挥的空间很小,就好像我们无法决定DOTA里允许多少种操作,也无法改变一台机器人的关节数量和各自的角度范围,Gym用户甚至从来都不用为这个问题操心,action空间有多少维,连续还是离散,各种domain早
wyjjyn
·
2023-11-27 01:34
深度强化学习落地方法论
人工智能
深度强化学习
AI落地
《
深度强化学习
落地指南》读书笔记2--动作空间设计
动作空间设计大有可为动作空间设计:这里大有可为动作空间设计三原则动作空间设计:这里大有可为你好!这是你第一次使用Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器,可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。概要:对于特定任务而言,动作空间在事实上决定了任何算法所能达到的性能上限;action、state、reward三者之间常常需要一定的协同设计。
第一剑柄
·
2023-11-27 01:03
人工智能
机器学习
深度强化学习
中的动作屏蔽(Action Masking)
RLlib中的example有一个代码是action_masking,很感兴趣,所以学习了一下主要功能是:“动作屏蔽”允许代理根据当前观察选择动作。这在许多实际场景中非常有用,在这些场景中,不同的时间步长可以执行不同的操作。解释动作屏蔽的博客文章:https://boring-guy.sh/posts/masking-rl/RLlib支持动作屏蔽,即通过稍微调整环境和模型来禁止这些动作,如本示例所
星行夜空
·
2023-11-27 01:58
python
深度学习
pytorch
文档资料
机器学习
自动驾驶轨迹预测学习笔记
QCNeXt:新一代
多智能体
联合轨迹预测框架CVPR2023轨迹预测冠军方案!QCNeXt:新一代
多智能体
联合轨迹预测框架
AI视觉网奇
·
2023-11-27 00:19
视觉跟踪
自动驾驶
学习
笔记
基于通用学习环境和
多智能体
深度强化学习
的列车运行图
2.摘要针对不同铁路系统的列车运行图问题,本文提出了一种
多智能体
深度强化学习
方法。建立了一个通用的列车运行图学习环境,将
当交通遇上机器学习
·
2023-11-26 02:44
大数据
算法
python
机器学习
人工智能
Gym迎来首个完整环境文档,强化学习入门更加简单!
深度强化学习
实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/编辑:OpenDeepRLOpenAIGym是一款用于研发和比较强化学习算法的环境工具包
Datawhale
·
2023-11-25 21:56
算法
python
java
人工智能
深度学习
《分布式自治智能体》_笔记
*分布式自治智能体1.分布式自治智能体系统建模对人工生命、进化算法、
多智能体
理论和自治计算做了深入的研究,通过研究人类社会的组织方式,以及人的繁殖、迁徙、死亡等行为,构建了一个分布式自治智能体系统框架。
alphonseLin
·
2023-11-24 19:03
基于cpt的组网实验_基于E-PUCK 2.0
多智能体
自主协同 高频投影定位系统
群体智能机器人是一种国际前沿的人工智能研究项目,由多个小型机器人组成的集群式解决系统,灵感源于蚂蚁、蜜蜂、鱼等群体生物,在没有统一领导的情况下,也能合作执行大量复杂的任务,比如组建一个图形,再在此基础上一步叠加复杂的任务,最终实现整个人工智能的突破,无限接近、甚至超越人类。群体智能机器人的运用前景非常广泛,包括智慧城市、智慧医疗、智能制造等方面,甚至在军事战略中也发挥巨大作用。高频定位系统通过采用
weixin_39833290
·
2023-11-23 05:18
基于cpt的组网实验
宝元系统通讯软件recon
【重磅】ICLR2020 || 106篇
深度强化学习
顶会论文汇总
关注:决策智能与机器学习,深耕AI脱水干货来源|EndtoEnd.ai作者|DeepRL报道|
深度强化学习
实验室编辑|九三山人【导读】今年的ICLR大会转到了线上举行,DeepMind和哈佛的研究人员投稿了一篇神经网络控制虚拟小白鼠模的论文十分亮眼
九三智能控v
·
2023-11-23 00:27
Talk | CoRL‘23 最佳系统论文奖入围,庄子文:用
深度强化学习
让机器狗学会跑酷
他与大家分享的主题是:“用
深度强化学习
让机器狗学会跑酷”,系统地介绍了他的团队在基于强化学习算法和软动力学约束让四足机器人的运动能力远超传统移动机器人的算法所做的一系列研究成果。
TechBeat人工智能社区
·
2023-11-22 13:56
每周Talk上架
机器人
机器人极限运动
深度强化学习
Talk | PSU助理教授吴清云:AutoGen-用
多智能体
对话开启下一代大型语言模型应用
她与大家分享的主题是:“AutoGen:用
多智能体
对话开启下一代大型语言模型应用”,系统地介绍了AutoGen的几个关键设计和特点和由AutoGen支持的各种应用。
TechBeat人工智能社区
·
2023-11-22 13:51
每周Talk上架
自然语言处理
机器学习
AI
Agent
大模型
关于STARMAC旋翼机的计算系统组成分析
theStanfordTestbedofAutonomousRotorcraftforMulti-AgentControl”,是斯坦福大学为为了突破先前飞行器笨重、结构复杂的限制,开发出的自主旋翼飞行器
多智能体
控制测试平台
银角大王陈
·
2023-11-22 06:46
STARMAC
计算机处理系统
深度学习基础
深度强化学习
教程链接DataWhale强化学习课程JoyRLhttps://johnjim0816.com/joyrl-book/#/ch7/main深度学习基础强化学习的问题可以拆分成两类问题,即预测与控制
数分虐我千百遍
·
2023-11-22 01:04
深度学习
人工智能
MATLAB代码:基于
多智能体
系统一致性算法的电力系统分布式经济调度策略
MATLAB代码:基于
多智能体
系统一致性算法的电力系统分布式经济调度策略关键词:一致性算法
多智能体
分布式调度仿真平台:MATLAB平台参考文档:中文复现,效果非常好,想看文献和运行效果加好友主要内容:代码主要做的是电力系统的分布式调度策略
「已注销」
·
2023-11-21 06:20
分布式
MATLAB代码《基于
多智能体
系统一致性算法的电力系统分布式经济调度》
MATLAB代码《基于
多智能体
系统一致性算法的电力系统分布式经济调度》软件环境:MATLAB内容:集中式优化方法难以应对未来电网柔性负荷广泛渗透以及电力元件“即插即用”的技术要求。
「已注销」
·
2023-11-21 06:19
matlab
分布式
开发语言
文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《基于
深度强化学习
的园区综合能源系统低碳经济调度》
这个标题涉及到基于
深度强化学习
的园区综合能源系统低碳经济调度。让我们逐步解读一下:1.园区综合能源系统:指的是一个区域内综合利用多种能源的系统,可能包括电力、热能、风能、太阳能等。
电网论文源程序
·
2023-11-20 18:04
文章解读
能源
分布式
集简云 x 度量科技丨打通企业微信OA审批与招银云直联,实现支付信息自动同步网银系统
度量的核心产品——NOKOV(度量)光学三维动作捕捉系统,采用高性能红外摄像头捕捉反光标识点,采集并生成精准、实时的动作信息,可广泛应用于无人机室内定位追踪、
多智能体
协同控制、虚拟数字人、军事军工等领域
集简云-软件连接神器
·
2023-11-20 11:53
科技
企业微信
api
集简云
人工智能
强化学习中的Transformer发展到哪一步了?清北联合发布TransformRL综述
©作者|WenzheLi等来源|机器之心强化学习(RL)为顺序决策提供了一种数学形式,
深度强化学习
(DRL)近年来也取得巨大进展。然而,样本效率问题阻碍了在现实世界中广泛应用
深度强化学习
方法。
PaperWeekly
·
2023-11-19 19:05
transformer
深度学习
自然语言处理
神经网络
人工智能
小白也想写综述(一)
前言在选择科研方向时,考虑自己的兴趣和职业目标是非常重要的:综述论文的价值:撰写综述论文,尤其是在
深度强化学习
和区块链这样的前沿技术领域,能够帮助建立扎实的理论基础,并且对整个领域有一个全面的认识。
Joy T
·
2023-11-19 10:38
机器学习
综述写作
人工智能
小白也想搞科研(一)之DRL优化数据库查询执行计划
我知道
深度强化学习
在许多领域都取得了显著的成果,你觉得我们可以如何将DRL应用到数据库优化中?研究员B:一个有趣的应用可能是使用DRL来优化查询执行计划。
Joy T
·
2023-11-19 10:38
综述写作
数据库
mysql
基于
深度强化学习
的智能汽车决策模型
1.基于
深度强化学习
的智能汽车决策模型以神经网络为核心的智能体最主要的优势在于其依靠大量的数据自主学习的能力,通过数据驱动智能体可以应对各种未经历过的复杂环境。
闲看庭前梦落花
·
2023-11-19 01:34
强化学习
汽车
人工智能
机器学习
英伟达用AI设计GPU:最新H100已经用上,比传统EDA减少25%芯片面积
在最新论文中,他们介绍了如何用
深度强化学习
agent设计电路的方法。据研究人员称,这种方法还属业内首次。值得一提的是,这篇文章包含参考文献在内,仅有短短6页。不少网友表示,太酷了!
QbitAl
·
2023-11-18 20:52
芯片
人工智能
深度学习
机器学习
算法
GAN-DQN
GAN-DQN本期介绍一项来自麦吉尔大学的有趣工作,它拓展了分布强化学习在深度学习框架下的应用,提出了一个十分有趣的
深度强化学习
框架:GAN+DQN。
GPlearndunk
·
2023-11-17 05:17
分布强化学习
深度强化学习
GAN
对抗生成网络
DRL
分布强化学习
Go-Bigger
多智能体
决策智能挑战赛来了!
《球球大作战》是一款风靡全球的休闲电子竞技游戏,以大球吃小球为目标,简单有趣却又斗智斗勇。你不知道的是,AI世界也拥有了自己的《球球大作战》。前不久,OpenDILab开源了一款妙趣丛生的竞技游戏环境Go-Bigger,其中充满各种紧张刺激的合作与博弈。不过在这个游戏中,主角并不是人类,而是AI智能体。这是一个是专为AI准备的游戏环境,AI探索家们既可以使用当今最热的强化学习决策方法,也可以结合传
Datawhale
·
2023-11-17 03:41
游戏
人工智能
大数据
强化学习
编程语言
深度强化学习
论文中的阴影折线图——总结和分析
前言作为目前人工智能算法的一个重要领域,强化学习算法的表现非常出色,然而,强化学习算法的结果是出了名的不稳定:超参数的搜索空间往往非常大,算法对不同超参数都较为敏感,且哪怕仅仅只有随机数种子的不同,算法的结果都可能出现不小的偏差。因此,当今主流的论文都会汇报多个随机数种子下,强化学习算法的平均表现。为了能将算法的表现与随机性同时展示在同一张图中,论文一般会使用带阴影区域的折线图来汇报训练过程中,r
别出BUG求求了
·
2023-11-14 18:11
数据处理
深度强化学习
阴影折线图
多智能体
一致性(Consensus)中的矩阵理论(Matrix Theory)
文章目录写在前面一致性算法连续时间离散时间一致性证明连续时间离散时间矩阵理论特征值和特征向量特征多项式代数重数几何重数总结写在前面最近在看一些分布式优化的文章,但是大部分文章都是用的离散时间算法。我之前一直研究的是连续时间一致性(consensus)控制问题,现在想把离散时间控制拾起来。这篇文章前半部分讲解连续和离散系统的一致性算法,互相做个对比,加深一下印象和理解;后半部分回顾在算法证明中会用到
东南坼
·
2023-11-14 17:37
控制理论
线性代数
矩阵
图论
强化学习:10种真实的奖励与惩罚应用
在自动驾驶汽车中的应用各种论文都提出了“
深度强化学习
用于自动驾驶”。
AI科技大本营
·
2023-11-14 15:48
大数据
机器学习
人工智能
深度学习
python
【新书推荐】【2020】
深度强化学习
人类最好从反馈中学习,我们被鼓励采取能带来积极结果的行动,同时又被消极后果的决定所吓倒。这种强化过程可以应用到计算机程序中,使它们能够解决经典编程无法解决的更复杂的问题。Humanslearnbestfromfeedback—weareencouragedtotakeactionsthatleadtopositiveresultswhiledeterredbydecisionswithnegati
梅花香——苦寒来
·
2023-11-13 18:57
DoorGym:开源的可拓展的开门仿真环境,用于域随机化的强化学习、
深度强化学习
0.概述目的:创建一个可以改变门把手形状、类型、位置、环境颜色、照明条件、机械臂结构的仿真环境,以训练出鲁棒性更高、更能关注到任务本质特征、容易迁移到现实的模型网址:环境下载,1.领域随机化DR假设很难对目标域进行完美建模,但很容易创建许多不同的模拟来近似目标域2.引擎Unity:用来为视觉提供渲染画面Mujoco:使用对应框架和接口3.环境组成:机械臂、门、门把手、门框、墙;其中前三者的物理特性
阿航626
·
2023-11-12 04:57
机器人操作持续学习论文
开门
PPO
机器人
机器人学习
强化学习
机械臂
机器学习之
深度强化学习
机器学习之
深度强化学习
机器学习最酷的分支应该算是深度学习(Deeplearning)和强化学习(Reinforcementlearning)。
丫头片子不懂事
·
2023-11-11 06:11
机器学习
深度学习
机器学习
【
深度强化学习
】1. 基础部分
文章目录强化学习纲要-基础部分强化学习应用案例强化学习在做什么?基本要素分类1.按照Agent有没有对环境建模来分类2.按照Agent的决策方式来分类时序决策过程动作空间智能体主要组成部分1.Policy2.ValueFunction3.ModelExplorationandExploitation知识点补充致谢参考内容强化学习纲要-基础部分【DataWhale打卡】第一天:学习周博磊讲的强化学习
*pprp*
·
2023-11-10 13:22
深度强化学习入门
深度学习
pytorch
神经网络
强化学习
Talk | 马里兰大学博士生吴曦旸:分布式
多智能体
强化学习在复杂交通轨迹规划中的应用
他与大家分享的主题是:“分布式
多智能体
强化学习在复杂交通轨迹规划中的应用”,介绍了他的团队在运用意图感知进行轨迹规划的分布式
多智能体
强化学习算法的相关研究上所做的一系列研究成果。
TechBeat人工智能社区
·
2023-11-10 12:17
每周Talk上架
机器人
机器学习
自动驾驶
强化学习
Jupyter Notebook:内核似乎挂掉
项目场景:提示:这里简述项目相关背景:项目场景:
深度强化学习
在中国股票量化交易上的应用,要求跑赢大盘问题描述提示:这里描述项目中遇到的问题:使用JupyterNotebook运行时,跑到绘图部分,崩溃了
梦断紫丁香
·
2023-11-09 04:25
FinRL
python
深度学习
多智能体
强化学习设计20231108
1.什么样的问题适合用
多智能体
强化学习?
多智能体
强化学习适用于一系列问题,特别是那些涉及多个智能体相互作用的场景。
喝凉白开都长肉的大胖子
·
2023-11-09 01:47
强化学习
经验技巧
强化学习
Multi
Agent
RL
多智能体
强化学习的主要流程是什么?训练方式跟单智能体有什么不同?
多智能体
强化学习(Multi-AgentReinforcementLearning,MARL)是一种用于处理多个智能体相互作用的强化学习问题的方法。
喝凉白开都长肉的大胖子
·
2023-11-09 01:46
经验技巧
强化学习
python
强化学习
深度学习
深度强化学习
具有非线性动态行为的多车辆列队行驶问题的基于强化学习的方法
研究人员专注于通过传统控制策略以及最先进的
深度强化学习
(RL)方法解决自动驾驶车辆控制的各种方法。在这项研究中,除了提出基于RL的最优间隙控制器之
龙晨天
·
2023-11-07 20:21
自动驾驶
车辆编队
深度强化学习
LTI
多智能体
系统中分布式观测器的设计概述
LTI
多智能体
系统中分布式观测器的设计概述摘要随着信息技术和云计算的快速发展,传感器网络在我们的社会中发挥着越来越重要的作用。
龙晨天
·
2023-11-07 20:21
多智能体系统(控制领域)
分布式
多智能体
系统集群协同控制实验平台详解与典型案例
目录一、机器人实验是智能体集群研究必要手段二、动作捕捉系统解决智能体集群实验系统多个痛点三、
多智能体
集群协同控制实验平台1.Crazyswarm多无人机集群编队实验平台2.Robotarium机器人平台
MocapLeader
·
2023-11-06 22:06
动作捕捉
控制系统
协同控制
集群
利用
深度强化学习
求解车辆调度问题时的框架该怎么样设计?
设计一个
深度强化学习
框架来解决车辆调度问题是一个复杂而有挑战性的任务。
喝凉白开都长肉的大胖子
·
2023-11-06 01:06
深度学习
强化学习
科研技巧
python
经验分享
深度学习
机器学习
Google DeepMind研究员杨梦娇:基础模型与顺序决策的问题、方法、及应用
她的研究兴趣包括模仿学习、
深度强化学习
(RL)、顺序决策、和基础模型。她的工作涵盖了离线强化学习、顺序决策的表示学习,以及控制、规划和RL的生成建模。
智源社区
·
2023-11-05 22:21
人工智能
计算机视觉
深度学习
机器学习
算法
强化学习路线规划之
深度强化学习
代码
虽然说很多代码都有问题,但是不管它们,我不是为了去debug,紧盯住自己的目标,目标是整理出一条通常的强化学习之路,让自己以及看到这些博客的大家在学习的时候能够少走一些弯路。所以从q-learning和Sarsa开始,这些基础代码不需要借助框架,所以没什么太大问题。但是深度学习的话就要借助TensorFlow或者pytorch框架,而这两个框架都分别出了两个版本,就导致前后的兼容性较差,前人的经验
eyexin2018
·
2023-11-05 20:16
强化学习
python
深度学习
机器学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他