E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
强化学习公开课
AAAI 2020多智能体强化论文
强化学习
最新论文汇总如有错误,欢迎指正所引用内容链接Multi-AgentRL1.PartnerSelectionfortheEmergenceofCooperationinMulti‐AgentSystemsusingReinforcementLearning2
rockray21
·
2024-01-31 18:08
强化学习
强化学习
强化学习
-google football 实验记录
googlefootball实验记录1.gru模型和dense模型对比实验实验场景:5v5(控制蓝方一名激活球员),跳4帧,即每个动作执行4次实验点:修复dense奖励后智能体训练效果能否符合预期实验目的:对比gru长度为16和densenet作为aggrator的区别实验效果reward敌方得分我方得分熵实验结论:相较于长度16的gru,densenet作聚合器有益于快速收敛。gru聚合器学到了
BIT龙超越
·
2024-01-31 18:06
人工智能
一起学习飞桨 深度
强化学习
算法DQN
LEARN_FREQ=5#trainingfrequencyMEMORY_SIZE=200000MEMORY_WARMUP_SIZE=200BATCH_SIZE=64LEARNING_RATE=0.0005GAMMA=0.99#trainanepisodedefrun_train_episode(agent,env,rpm):total_reward=0obs=env.reset()step=0w
路人与大师
·
2024-01-31 18:35
学习
paddlepaddle
算法
《静悄悄地革命》第二章改变教学读书打卡
作为一线教师,改变教学要从自身做起,我们可以把每次的
公开课
作为一种观摩,一种学习,一种资源共享的开放式合作,从别人那里吸收精华,再用到自己的课堂中,尝试改变自己的课堂,改变学生的学习氛围。另外,在课
0e4dc06988f8
·
2024-01-31 18:57
移动机器人的几种视觉算法 | 硬创
公开课
谈到移动机器人,大家第一印象可能是服务机器人,实际上无人驾驶汽车、可自主飞行的无人机等等都属于移动机器人范畴。它们能和人一样能够在特定的环境下自由行走/飞行,都依赖于各自的定位导航、路径规划以及避障等功能,而视觉算法则是实现这些功能关键技术。如果对移动机器人视觉算法进行拆解,你就会发现获取物体深度信息、定位导航以及壁障等都是基于不同的视觉算法,本期硬创公开就带大家聊一聊几种不同但又必不可少的视觉算
leiphone
·
2024-01-31 14:46
硬创公开课
机器人
算法
移动
导航
技术
2019-11-04课课皆精心(七)
翻着记得密密麻麻的听课记录本,觉得如果不抓紧时间记下自己的收获,实在辜负了把培训的机会让给我的任老师,也辜负了来自全国各地为我们呈现了11节精彩纷呈的
公开课
的老师们。
夏红90
·
2024-01-31 13:08
机器学习
强化学习
深度学习的区别与联系
机器学习
强化学习
深度学习机器学习按道理来说,这个领域(机器学习)应该叫做统计学习(StatisticalLearning),因为它的方法都是由概率统计领域拿来的。
坠金
·
2024-01-31 12:10
机器学习
机器学习
人工智能
深度学习
Ruff 企业链改案例
公开课
(第一期)即将开启
在即将过去的2018年,区块链技术无疑是最受关注的新技术之一,不管是从数字货币市场还是技术应用领域,众多创业公司、传统企业以及技术开发者都期待着区块链技术可以在合适的场景中实现落地运用,同时,也有很多人充满好奇区块链技术究竟带来了哪些改变和价值!Ruff区块链项目的初衷就是实现企业级的快速交付,不管是业务分析层面还是技术落地层面,都希望可以将真正的有价值的技术赋能给传统企业,因此,在2018年的尾
玄居Ruff IoT
·
2024-01-31 12:03
物联网区块链
Ruff
区块链
物联网
公开课
红了半个朋友圈——今天也聊一聊志红
先是她出的新书《
公开课
:炼就与生成》,然后是因为这本书将举行的一个线上会谈。因为志红,近几天我半个朋友圈都红了。
小尘老师
·
2024-01-31 11:19
提前半小时出发
她说有两个没来的,由于考试的人数多,把
公开课
的流程缩短了,所以进度比原来预想的快了。让我赶紧到,不然就迟到了。我心里一下子着急了。祈
风中的糯米
·
2024-01-31 11:58
不同的
强化学习
模型适配与金融二级市场的功能性建议
以下是对您列出的几种
强化学习
模型的简要概述,以帮助您做出选择:DQN(DeepQ-Network):适合:适用于离散动作空间的
强化学习
任务。
路人与大师
·
2024-01-31 09:54
金融
谈一谈深度学习与机器学习
机器学习包括多种方法:除了深度学习,机器学习还包括传统的监督学习、无监督学习、
强化学习
等方法,这些方法可以使用各种不同的算法和技术。优缺
流浪字节π
·
2024-01-31 09:07
人工智能
深度学习
机器学习
人工智能
icra2021 reinforcement learning paper list
reinforcementlearningAutonomousVehicleNavigationDeepReinforcementLearningforMaplessNavigationofaHybridAerialUnderwaterVehiclewithMediumTransition自从在Atari类游戏中将深度Q学习应用于连续动作域以来,用于运动控制的深度
强化学习
吃醋不吃辣的雷儿
·
2024-01-31 08:09
团队文化之表扬和批评
点击链接加入QQ群229390571(免费
公开课
、视频应有尽有):https://jq.qq.com/?_wv=1027&k=5rbudQa顺境出人才还是逆境出人才,是一个很古老的话题。
测试帮日记
·
2024-01-31 08:26
订单退款&重复支付需求疑问点归纳整理
注意:携带有2位小数的退款操作答:遵守可退款金额=实付金额-已退款金额逻辑;即使0元退款按钮也正常显示3.0元免费领取
公开课
、单科
米不开朗基罗
·
2024-01-31 08:12
《夏天里的成长》课后反思
今天我讲了一节六年级语文
公开课
《夏天里的成长》,这是一篇通过描写夏天里万物都在成长的自然现象,说明人要把握时间,“尽量地用力地长”的哲理散文。课文的中心句是第一句,即课文的第一自然段。
白沙小学程利娜
·
2024-01-31 07:36
吉祥谈亲子与父母
我正在看【孩子不同年龄,父母不同角色-免费
公开课
】,分享给你,一起看吧!
简simeha
·
2024-01-31 04:26
悠季瑜伽
公开课
感悟2: 从来没想过在瑜伽练习中要当一只愤怒的狮子
每次悠季瑜伽的线下
公开课
,我都非常喜欢参加。2020年12月19日,我又在北京学院呆了一天,上了四节课,感觉收获了满满的能量,很知足。第一节课是默瀚老师的晨练。
惰惰的瑜伽笔记
·
2024-01-31 03:42
从打开写作之门到靠写作月收入5千元的蜕变
并在文末为大家精心准备了建议阅读的书单,写作心得(体会.技巧),写作平台(投稿.赚钱),关于写作的
公开课
和有关书籍。前些天,和几个相知的朋友小聚,因为大家都是文字爱好者的缘故,聊天的话题总离
菩提树下参禅读书
·
2024-01-30 22:52
数据结构--顺序表的基本操作[王道]
截图来自王道数据结构
公开课
目录1.插入操作代码时间复杂度分析2.删除操作代码时间复杂度分析3.按值寻找(顺序查找)代码时间复杂度4.按位寻找(按序号查找)代码快速回顾顺序表的定义以及特点:数据结构-顺序表的实现
洛杉矶县牛肉板面
·
2024-01-30 16:10
日常学习笔记
数据结构
小程序的第六年,我们还能怎么玩?
在今年的微信
公开课
Pro公开数据得知,微信小程序数量300万+(占全网小程序数量43%),DAU(日均活跃用户数量)4.5亿,同比增长32%。活跃小程序稳步增长41%,有交易的小程序数持续增长28%。
知晓云
·
2024-01-30 15:47
最新资讯
小程序
前端
小程序
微信小程序
微信
21天写作课d1
无意间,看到网易
公开课
上他的21天写作课程特训营,正好需要提高自己的写作技能。第一课,学习了老师总结的万能写作法,也就是最根本的思考表达框架。
马布罗克
·
2024-01-30 15:20
跟100位大师练,练完就成高手丨写作工具箱 79
大师写作100练丨文/张伟蹯溪百日极致写作练习营这是椰子私塾第1835篇原创输出跟100位大师练,练完就成高手丨写作工具箱79网大
公开课
学习摘要——环境建构。1、环境与类型、主题。小说环境是什么?
丨张伟丨
·
2024-01-30 14:18
我发现我最近好像老年人的心理越来越明显
前不久听了一堂心理
公开课
,有一堂课讲了老年人心理的几种特征。1.老年人相对比较固执,觉得自己有经验,并相信自己的经验。
逸尘读书
·
2024-01-30 09:25
深度
强化学习
(王树森)笔记09
深度
强化学习
(DRL)本文是学习笔记,如有侵权,请联系删除。本文在ChatGPT辅助下完成。
阿正的梦工坊
·
2024-01-30 09:19
Reinforcement
Learning
强化学习
《操场上》教学反思
彭婆小学王利格记得去年的校级
公开课
,我讲的是《操场上》这一课。这是一节识字课,从体育活动中识带“扌"和“足”字旁的字。并能根据偏旁猜字意。去年讲的时候,我精心的准备了课件,设计了教学环节和学生活动。
60e57ccab38a
·
2024-01-30 07:56
大规模 AI 高性能网络的设计与实践
欢迎来到百度智能云云智
公开课
AI大底座的系列分享。今天晚上由我来开启本轮系列分享的第一场,聚焦百度智能云AI大底座的关键技术——大规模AI高性能网络。本次分享我们分为三个小节。
百度智能云技术站
·
2024-01-30 06:00
百度百舸·AI
异构计算平台
人工智能
百度
AIGC
百度百舸平台的大模型训练最佳实践
今天的分享是百度智能云在23年夏季推出的「云智
公开课
—AI大底座系列」第8期,也是本次活动的最后一期。
百度智能云技术站
·
2024-01-30 06:00
百度百舸·AI
异构计算平台
百度
人工智能
AIGC
动手学深度学习(一)深度学习介绍1
2.4优化算法:3.各种机器学习问题:3.1监督学习:3.1.1回归:3.1.2分类:3.1.3标记问题:3.1.4搜索:3.1.5推荐系统:3.1.6序列学习:3.2无监督学习:3.3与环境互动:3.4
强化学习
Shining0596
·
2024-01-30 02:32
学习
人工智能
深度学习
深度学习
人工智能
学习
其他
一场关于生命与哲思的对话
9月25日,在西湖大学湖心讲堂2021秋季
公开课
暨湖心
公开课
开讲一周年活动上,古生物学家周忠和院士、华东师范大学紫江特聘教授刘擎教授,以古生物学与哲学的双重视角,共话“演进的史诗”。
qingkong334
·
2024-01-30 02:19
深度
强化学习
(王树森)笔记07
深度
强化学习
(DRL)本文是学习笔记,如有侵权,请联系删除。本文在ChatGPT辅助下完成。
阿正的梦工坊
·
2024-01-30 00:53
Reinforcement
Learning
强化学习
滕滕每日PHAIO 2022年6月15号(第206天)
滕滕每日PHAIO2022年6月15号(第206天)P(明日计划):1、下午
公开课
学习2.和金环梳理暑假开课流程细则责任人H-健康:无A-心态:有开心有不舍I-输入:听一本书“拆掉思维里的墙”O—输出:
奋力奔跑人
·
2024-01-29 19:59
有关机器学习的两种算法特点
机器学习算法主要有三大类:监督学习、无监督学习和
强化学习
。监督学习:使用预定义的“训练示例”集合,训练系统,便于其在新数据被馈送
轻雨科技
·
2024-01-29 17:49
感动
又是三次
公开课
,周末加班,真是把自己累惨了。本来想放弃的工作,今天出乎意料的得到了鼓励,让我加油,坚持下去,相信自己。内心特别感动,为自己打气,克服困难,安排好时间,相信功夫不负有心人。加油。
Lisa英语老师
·
2024-01-29 14:35
深度
强化学习
基本概念-王树森课程笔记
学习资料:深度
强化学习
课程-王树森目录一、概率论知识二、
强化学习
专业术语三、
强化学习
的随机性来源1.action2.statetransition四、Rewards,Returns&ValueFuctions1
淀粉爱好者
·
2024-01-29 12:06
机器学习
深度学习
深度
强化学习
_Actor-Critic 王树森课程笔记
Actor-CriticMethod一、ValueNetwokandPolicyNetwork1.Policynetwork(Actor):π(a∣s;θ)\pi(a|s;\bm\theta)π(a∣s;θ)2.Valuenetwork(Critic):q(s,a;w)q(s,a;\textbf{w})q(s,a;w)二、训练神经网络1.用TD算法更新价值网络2.用策略梯度算法更新策略网络三、Ac
淀粉爱好者
·
2024-01-29 12:06
神经网络
深度学习
机器学习
深度
强化学习
(王树森版)学习笔记(一)——机器学习基础
前言由于本人的工作与深度
强化学习
相关,想找个机会重新复习下深度
强化学习
的相关知识,正好手上有这本书,粗略一看感觉知识点挺简洁的,内容也挺全面,也提供了一些学习资料。所以开个坑记录一下这本书的学习过程。
向南而行灬
·
2024-01-29 12:35
机器学习
人工智能
深度学习
强化学习
(王树森)
目录基本概念价值函数目的基本概念**策略函数(policy)**是根据观测到的状态做出决策策略函数π\piπ:S×\times×A→\rightarrow→[0,1]是一个条件概率函数:π\piπ(a|s)=P(A=a|S=s)策略函数的输入是状态s和动作a,输出是一个0到1之间的概率值奖励(reward)是在智能体执行一个动作之后,环境返回给智能体的一个数值状态转移是指当前状态s变成新的状态s’
leukocyten
·
2024-01-29 12:05
强化学习
深度
强化学习
(王树森)笔记06
深度
强化学习
(DRL)本文是学习笔记,如有侵权,请联系删除。本文在ChatGPT辅助下完成。
阿正的梦工坊
·
2024-01-29 12:01
Reinforcement
Learning
强化学习
谷歌发布West-of-N,利用合成数据,显著提升LLM奖励模型质量 | 今日Arxiv最热大模型论文
这为改善人类反馈
强化学习
(RLHF)在语言模型对齐上提供了新的研究方向。引言:人类反馈对语言模型的影响在人工智能领域,语言模型的发展已经达到了令人瞩目的水平,它们能够生成流畅、连贯且在很多
夕小瑶
·
2024-01-29 12:51
人工智能
人工智能主要分支
其理论基础包括监督学习、无监督学习、
强化学习
。支持向量机(SupportVectorMachines)、决策树(Decisi
ByteSage.
·
2024-01-29 12:52
人工智能
读管建刚老师《一线带班》有感第六章
管老师说,
公开课
就像是谈恋爱,而常态课就像过日子,谈恋爱和过日子是不一样的。作为老师,我们既要会谈恋爱更要会过日子。常态课是学生们真实的写照,常态课也是一位老师最真实的一面。
Mr文二
·
2024-01-29 11:26
北京大学肖臻老师《区块链技术与应用》
公开课
笔记:BTC原理(一):密码学原理、数据结构、协议、实现
1、BTC-密码学原理比特币被称为加密货币(crypto-currency),但其实加密货币是不加密的,区块链上所有交易内容(包括账户地址、转账金额等)都是公开的。比特币中主要用到了密码学中的两个功能:哈希和签名1)、hash(哈希)在密码学中用的哈希函数被称为cryptographichashfunction,其两个重要性质分别为collisionresistance(抗碰撞性)和hiding(
邋遢的流浪剑客
·
2024-01-29 10:05
区块链
区块链
比特币
数据结构
区块链学习笔记2——BTC中的数据结构
区块链学习笔记2——BTC中的数据结构学习视频:北京大学肖臻老师《区块链技术与应用》笔记参考:北京大学肖臻老师《区块链技术与应用》
公开课
系列笔记——目录导航页本文主要介绍四种数据结构:Hashpointers
polarday.
·
2024-01-29 10:05
#
比特币
区块链
数据结构
比特币
02-BTC-数据结构
目录前言比特币的数据结构哈希指针(Hashpointers)默克尔树(Merkletree)前言学习肖臻老师的《区块链技术与应用》
公开课
笔记,供学习参考。
晏日雨
·
2024-01-29 10:35
区块链
OpenAI Gym 中级教程——深入
强化学习
算法
PythonOpenAIGym中级教程:深入
强化学习
算法OpenAIGym是一个用于开发和比较
强化学习
算法的工具包,提供了多个环境,包括经典的控制问题和Atari游戏。
Echo_Wish
·
2024-01-29 10:16
Python
笔记
Python算法
算法
数据结构-顺序表的实现 [王道]
博客中截图来自王道数据结构
公开课
目录顺序表的定义顺序表的特点顺序表的实现--静态分配顺序表的实现--动态分配顺序表的定义--知识结构框架顺序表的定义>线性表是具有相同(每个数据元素所占的空间一样大)数据类型的个数据元素的有限序列
洛杉矶县牛肉板面
·
2024-01-29 09:07
日常学习笔记
数据结构
算法
多智能体
强化学习
(概念知识,不涉及具体算法)
目录一、前置知识1.factoredvaluefunction2.partiallyobservableMDP(POMDP)problem.2.2Decentralized-POMDPproblem2.3networkeddecentralizedpartiallyobservableMarkovdecisionprocesses(ND-POMDP)problem2.4上述两种算法的区别3.Mea
还有你Y
·
2024-01-29 08:39
机器学习
深度学习
强化学习
算法
人工智能
多智能体
强化学习
--理论与算法
**critic网络:**MAPPO的actor和critic网络actor网络:critic网络:QMix(QMIX)VDN(ValueDecompositionNetworks)参考博士论文:基于
强化学习
的多智能体协同关键技术及应用研究基础概念在单个智能体与部分可观测环境的交互过程一般使用部分可观测马尔可夫决策过程
还有你Y
·
2024-01-29 08:09
机器学习
深度学习
强化学习
算法
多智能体
强化学习
--MAPPO(pytorch代码详解)
标题代码详解Actor和Critic网络的设置代码详解代码链接(点击跳转)Actor和Critic网络的设置基本设置:3个智能体、每个智能体观测空间18维。Actor网络:实例化一个actor对象,input-size是18Critic网络:实例化一个Critic对象,input-size是18x3=54在choose_action调用actor网络的时候,传入的直接是三个智能体的参数,tenso
还有你Y
·
2024-01-29 08:04
机器学习
深度学习
强化学习
pytorch
人工智能
python
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他