E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
cs285深度强化学习课程笔记
深度强化学习
-----actor-critic 方法
actor-criticactor是策略网络用来指导智能体去运动,可以看作运动员。critic是价值网络用来给动作打分可以看作裁判。搭建神经网络以超级玛丽为例搭建两个网络:价值网络有两个输入:状态s、动作a。分别使用卷积层和全连接层从输入中提取特征,得到两个特征向量,将两个特征向量拼接成一个更高的特征向量,使用一个全连接层输出一个实数,这个实数就是裁判给运动员的分数。这个分数说明处在状态s下采用动
烟、绕指凉~
·
2023-01-17 00:45
深度强化学习
强化学习
深度学习
计算机视觉
算法
0.强化学习概述+policy based+value based
目录
深度强化学习
目录简述
深度强化学习
(DeepReinforcementLearning)分为深度和强化两个部分。深度学习的好处是更深,更抽象的学习;而强化学习则是通过与环境产生互动来采取行动。
DKwtno
·
2023-01-17 00:15
深度强化学习
深度学习
强化学习
深度强化学习
基础知识----策略学习
我们要用一个神经网络来近似策略函数,这个网络叫做策略网络。它可以用来控制agent去运动。策略函数策略函数记作为π(a|s),它是一个概率密度函数,我们可以使用它来控制agent去运动。策略函数的输入是当前状态s,输出是一个概率分布,给每一个动作一个概率值。下图是超级玛丽游戏的例子只要有了好的策略函数π,我们可以使用它来控制agent去运动。问题是怎么得到这样的策略函数呢?我们需要用函数来近似,学
烟、绕指凉~
·
2023-01-17 00:15
深度强化学习
策略学习
强化学习
深度学习
【面试】2022秋招自动驾驶决策规划控制岗位面试总结
我学习期间的研究方向是
深度强化学习
,所以项目经历都与强化学习相关,面试官问项目时也会往这方向考察。鉴智机器人面试岗位:决策规划岗位笔试笔试出的是力扣原题。2道中等难度+1道困难题。
CZ一星弱火
·
2023-01-16 21:05
面试
面试
自动驾驶
职场和发展
吴恩达机器学习
课程笔记
:监督学习、无监督学习
1.吴恩达机器学习
课程笔记
:监督学习、无监督学习吴恩达机器学习系列课程:监督学习吴恩达机器学习系列课程:无监督学习仅作为个人学习笔记,若各位大佬发现错误请指正机器学习的学习算法:监督学习、无监督学习、半监督学习
Uncertainty!!
·
2023-01-16 17:31
机器学习基础
监督学习
无监督学习
图像处理、分析、识别、应用的
课程笔记
,PPT/PDF课件,计算机视觉中的机器学习、目标识别、分割、文本识别、fMRI 分析、运动和追踪等在线视频教程
包括图像处理、分析、识别、应用的
课程笔记
,PPT/PDF课件,计算机视觉中的机器学习、目标识别、分割、文本识别、fMRI分析、运动和追踪等在线视频教程。
u013476464
·
2023-01-16 10:19
【deep
learning
基础】
计算机视觉
机器学习
gitchat训练营15天共度深度学习入门
课程笔记
(十三)
第7章卷积神经网络7.5CNN的实现7.6CNN的可视化7.6.1第1层权重的可视化7.6.2基于分层结构的信息提取7.7具有代表性的CNN7.7.1LeNet7.7.2AlexNet7.5CNN的实现CNN各层示意图:隐藏层:Convolution-ReLU-Pooling输出层的前一层:Affine-ReLU输出层:Affine-SoftmaxSimpleConvNet初始化:参数和函数:in
weixin_43114885
·
2023-01-16 08:21
笔记
深度学习
新手
python
编程
经典书籍
gitchat训练营15天共度深度学习入门
课程笔记
(九)
第6章与学习相关的技巧6.1学习过程中参数更新最优化方法6.1.2SGD1.SGD的实现2.SGD的缺点6.1.4Momentum1.Momentum公式2.Momentum的实现6.1.5AdaGrad1.AdaGrad的公式2.AdaGrad的实现6.1.6Adam1.Adam的特点2.Adam的实现6.1.8基于MNIST数据集的更新方法的比较6.2权重初始值的设置方法6.2.2隐藏层的激活
weixin_43114885
·
2023-01-16 08:50
笔记
深度学习入门
新手
python编程
经典书籍
gitchat训练营15天共度深度学习入门
课程笔记
(十)
第6章与学习相关的技巧6.4正则化抑制过拟合的方法6.4.2权值衰减6.4.3Dropout6.5超参数的验证6.5.1验证数据6.5.2超参数的最优化6.5.3超参数最优化的实现6.4正则化神经网络发生过拟合的原因:模型拥有大量参数、表现力强训练数据少为了制造过拟合的神经网络来表现实验情况,选择了以下条件:训练数据:Minist数据集里的300(60000:300)个训练数据神经网络层数:7层隐
weixin_43114885
·
2023-01-16 08:50
笔记
深度学习入门
新手
python编程
经典书籍
gitchat训练营15天共度深度学习入门
课程笔记
(八)
第5章误差反向传播法5.4简单层的实现5.4.1乘法层的实现5.4.2加法层的实现5.5激活函数层的实现5.5.1ReLU层5.5.2Sigmoid层5.6Affine/Softmax层的实现5.6.1Affine层5.6.2批版本的Affine层5.6.3Softmax-with-Loss层5.7误差反向传播法的实现5.7.1神经网络学习的全貌图5.7.2对应误差反向传播法的神经网络的实现5.7
weixin_43114885
·
2023-01-16 08:50
笔记
深度学习入门
新手
python编程
经典书籍
Adaptive Supply Chain: Demand–Supply Synchronization Using Deep Reinforcement Learning翻译
自适应供应链:使用
深度强化学习
的供需同步摘要自适应和高度同步的供应链可以避免级联上升和下降的库存动态,并减轻由运营故障引起的连锁反应。
zzzzz忠杰
·
2023-01-16 06:11
RL&OR
自动驾驶
机器学习
深度学习
吴恩达深度学习
课程笔记
1.逻辑回归、梯度下降法、向量化2.广播、关于numpy向量的说明3.神经网络、激活函数、随机初始化4.超参数、划分数据集、偏差与方差、正则化5.
劳埃德·福杰
·
2023-01-15 16:17
Deep
Learning
深度学习
《电磁场与电磁波》
课程笔记
(一)——矢量与坐标系
第一课课程主要内容只上前五章前言电场磁场电磁波物质属性电磁场与电磁波是客观存在的一种物质,因为它具有物质的两种重要属性:能量和质量。但是,电磁场与电磁波的质量极其微小,因此,通常仅研究电磁场与电磁波的能量特性。场与介质电磁场与电磁波既然是一种物质,它的存在和传播无需依赖于任何介质.当空间存在介质时,在电磁场的作用下介质中会发生极化与磁化现象,结果在介质中又产生二次电场及磁场,从而改变了介质中原先的
Sandwich66
·
2023-01-15 13:22
电磁场与电磁波
电磁场
电磁波
吴恩达机器学习
课程笔记
(持续更新ing)
1.1什么是机器学习?定义:机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。解释:计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。例如:跳棋游戏E:程序与自己下几万次跳棋T:玩跳棋P:与新对手玩跳棋时赢的概率1.2监督学习定义:给算法一个数据集,其中包含了正确答案,算法的目的就是给出更多的正确答案。回归问题:目的:预测连续的数值例如:
最爱吃兽奶638
·
2023-01-15 11:15
Elasticsearch分布式引擎7.x,2021黑马详细
课程笔记
文章目录一、ES的一些概念1.1索引和映射ELS与Mysql的对比2.创建索引库:2.1mapping映射属性2.2索引库的CRUD2.2.1创建索引库和映射2.2.2查询数据库:2.2.3修改索引库,添加新字段2.2.4.删除索引库2.2.5总结3.文档操作3.1.新增文档查询文档3.3删除文档3.4修改文档3.4.2只修改Id匹配的文档中的部分字段3.5总结4RestAPI--javaClie
要去北上广的sakura
·
2023-01-15 07:27
微服务
elasticsearch
分布式
java
基于
深度强化学习
的智能车间调度方法研究
其次,将作业调度过程看作是从一个序列到另一个序列的映射,提出了一种基于
深度强化学习
的车间调度算法。通过分析模型在不同参数设置下
宋罗世家技术屋
·
2023-01-14 15:12
网络通信安全及科学技术专栏
网络
Andrew Ng Machine Learning 专题【Introduction】
此文是斯坦福大学,机器学习界superstar—AndrewNg所开设的Coursera课程:MachineLearning的
课程笔记
。力求简洁,仅代表本人观点,不足之处希望大家探讨。
IronYoung
·
2023-01-14 11:46
Machine
Learning
Machine
Learning
课程笔记
机器学习
machine
Andrew-Ng
q learning 参数_
深度强化学习
之深度Q网络DQN详解
引言本文将对
深度强化学习
中经典算法DQN进行详细介绍,先分别介绍强化学习和Q-学习,然后再引入
深度强化学习
和DQN。本文所有参考资料及部分插图来源均列在文末,在文中不做额外说明。
weixin_39799561
·
2023-01-14 11:56
q
learning
参数
q
learning简单理解
基于模型的强化学习笔记
深度强化学习
研究的一个主要重点是提高样本效率,基于模型的强化学习(MBRL)是最重要的方向。看了老师推荐的书马尔可夫决策
小蜗子
·
2023-01-14 08:42
研究方向
人工智能
蓝桥杯单片机学习笔记
目录前言一、基础代码二、相关特殊功能寄存器三、
课程笔记
m0_63848870
·
2023-01-14 08:36
学习
吴恩达deeplearning.ai系列
课程笔记
+编程作业(7)第二课 改善深层神经网络-第三周 超参数调试、Batch正则化和程序框架(Hyperparameter tuning)
第二门课改善深层神经网络:超参数调试、正则化以及优化(ImprovingDeepNeuralNetworks:Hyperparametertuning,RegularizationandOptimization)第三周超参数调试、Batch正则化和程序框架(Hyperparametertuning)文章目录第二门课改善深层神经网络:超参数调试、正则化以及优化(ImprovingDeepNeural
geekxiaoz
·
2023-01-14 07:09
超参数
softmax
归一化
Batch
Norm
TensorFlow
【CS 285 DRL Homework 1】模仿学习的策略函数
关于
CS285
深度强化学习
Homework1的笔记很少,百度到前年一些同学的笔记,感觉有点不太对。。这里写一些个人理解,敬供各位批评。
·
2023-01-13 17:35
这些是最热门的机器学习技术!
经过近几十年的发展,机器学习的方法也越来越成熟,主要有以下几种:监督学习无监督学习强化学习深度学习
深度强化学习
如上图所示,机器学习是从左往右的发展方向,每一阶段的学习方法都比上一代优秀了很多。
Metahuber
·
2023-01-13 13:42
人工智能
人工智能
深度学习
深度强化学习
专栏 —— 1.研究现状
戳这里猜你想看:
深度强化学习
专栏——1.研究现状
深度强化学习
专栏——2.手撕DQN算法实现CartPole控制
深度强化学习
专栏——3.实现一阶倒立摆pybullet杂谈:使用深度学习拟合相机坐标系与世界坐标系坐标变换关系
bug404_
·
2023-01-13 08:02
深度强化学习
深度强化学习
强化学习
机器学习 | 李宏毅
课程笔记
(一)基本概念
什么是机器学习?让机器具备自动找到一个函数function的能力(函数f输入x—输出f(x))应用函数输入函数输出语音识别声音信号音频对应文字图像分类图片图片内包含内容AlphaGo下围棋黑白棋的位置下一步应该落子的位置2.机器学习的三大任务任务函数输出实例Regression回归连续数值PM2.5预测Classification分类二分类(BinaryClassification)离散的值(从设
Hygge0+
·
2023-01-11 20:06
深度学习
人工智能
深度学习
【深度学习】02-01-机器学习任务攻略-李宏毅老师21&22深度学习
课程笔记
02-01-机器学习任务攻略FrameworkofMLGeneralGuideLargeLossonTrainingDataSolution1:ModelBias(MakeYourModelComplex)Solution2:OptimizationIssueWhichOne?GainingtheinsightsfromcomparisonStartfromshallowernetworks(or
暖焱
·
2023-01-11 20:04
#
深度学习-李宏毅
深度学习
机器学习
人工智能
演化强化学习:Wuji: Automatic Online Combat Game Testing Using Evolutionary Deep Reinforcement Learning
0摘要这篇文章的摘要没有提到很多感兴趣的东西,一句话概括就是Wuji模型可以使用
深度强化学习
去进行游戏测试,是一个多任务智能体,不仅要通关游戏,还要尽可能的去探索游戏,找到游戏中的bug。
特特丶
·
2023-01-11 17:29
人工智能
神经网络
算法
利用fft计算时域卷积重叠法保留_【GAMES101-现代计算机图形学
课程笔记
】Lecture 06 光栅化 2 (反走样)...
1.回顾和本节摘要1.1上一节内容回顾ViewingView+Projection+Viewport(将cuboid变换到屏幕空间)RasterizingtrianglesPoint-in-triangletestAliasing:像素引起的锯齿状失真。1.2本节内容概要:AntialiasingSamplingtheoryAntialiasinginpracticeVisibility/occl
weixin_39747568
·
2023-01-11 13:04
ICML2016最佳论文《
深度强化学习
的竞争网络架构》
获本年度ICML最佳的三篇论文如下:Monday–Ballroom3+4–12:04–DuelingNetworkArchitecturesforDeepReinforcementLearningZiyuWangGoogleInc.,TomSchaulGoogleInc.,MatteoHesselGoogleDeepmind,HadovanHasseltGoogleDeepMind,MarcLan
键盘手老张
·
2023-01-11 10:23
机器学习(人工智能)
机器学习
强化学习笔记
深度强化学习
要点摘要扩展资料交叉熵:https://blog.csdn.net/qq_38846606/article/details/111929038https://zhuanlan.zhihu.com
ICT_杜臻
·
2023-01-11 08:14
机器学习
人工智能
算法
强化学习笔记【12】DDPG
该系列主要是听李宏毅老师的《
深度强化学习
》过程中记下的一些听课心得,除了李宏毅老师的强化学习课程之外,为保证内容的完整性,我还参考了一些其他的课程,包括周博磊老师的《强化学习纲要》、李科浇老师的《百度强化学习
开心果小李
·
2023-01-11 08:14
强化学习
李宏毅
学习笔记
科学计算学习文章(持续更新
因学习需要,所以汇总了一些文章浅析GPU计算——cuda编程浅析GPU计算——CPU和GPU的选择GPU与CPU、显卡区别CPU与GPU并行计算联系与区别使用GPU加速计算
深度强化学习
是如何利用GPU进行并行计算的
BugII_
·
2023-01-10 19:16
并行计算
CPT101-Computer Systems
课程笔记
关于汇编的知识请移步文章AssemblyLanguage文章目录1.Overview2.I-OProcess2.1Input-Process-OutputModel2.2VonNeumannModel2.3Harvardarchitecture3.MachineinstructionsandHLL3.1Translation3.2Codesharingandreuse4.Data,Informat
SP FA
·
2023-01-10 16:03
CPT
computer
system
汇编
Discrete Optimization
课程笔记
(5)—混合整数规划
目录1.MIP介绍(MixedIntegerProgram)Case1:WarehouseLocationCase2:KnapsackProblem(BranchandBound)2.MIP模型(modeling)Case3:ColoringProblem(Big-MTransformation)3.割平面法(Cuttingplanes)4.多面体切割(PolyhedralCuts)Case4:N
bujbujbiu
·
2023-01-10 15:19
Coursera
算法
离散优化
混合整数规划
Discrete Optimization
课程笔记
(4)—前沿与工具
目录1.大规模邻域搜索(LargeNeighborhoodSearch)Case1:带时间窗的非对称TSP(AsymmetricTSPwithTimeWindows)2.列生成算法(ColumnGeneration)Case2:CuttingStock3.优化工具汇总1.大规模邻域搜索(LargeNeighborhoodSearch)大规模邻域搜索是局部搜索和CP/MIP的结合,例如CP和局部搜索
bujbujbiu
·
2023-01-10 15:19
Coursera
离散优化
运筹学
列生成算法
Deep Learning Specialization
课程笔记
——深度学习介绍
第一门课:神经网络和深度学习,会包含四周的课程,将学习如何建立神经网络,包括深度神经网络,以及如何用数据训练它。在这门课的结尾,将建立一个神经网络识别猫。whatisaneuralnetwork?一张图解释什么是ReLU函数,就像房价预测的曲线是一样的:(同时这张图展示了什么是单个的神经元neuron)影响房价的不同因素共同决定了housingprice:(这时,输入x参数是大小,卧室数量,邮政编
韬光养晦气
·
2023-01-09 00:17
深度学习coursera
深度学习
神经网络
NN
Deep
Learning
吴恩达深度学习工程师系列
课程笔记
(Deep Learning Specialization - deeplearning.ai)
深度学习笔记导航前言传送门完结感想前言选择吴恩达的深度学习视频作为入门是明智的选择,我对比过包括动手学深度学习在内的一些入门资料,感觉还是吴恩达的最为通俗易懂,虽然他在RNN那部分讲的一般,但是即使是这样,也是讲的比较好的。唯一的不太友好的点大概就是英文,好在b站有字幕版本的视频,刚开始可以开0.75倍速,虽然有字幕,但是我还是推荐把英文都听了,一方面锻炼听力,另一方面,字母还是差强人意,关键的部
亦梦亦醒乐逍遥
·
2023-01-09 00:42
人工智能
个人随笔/学习笔记
人工智能
深度学习
机器学习
cs223w
课程笔记
7-GNN2
GNN=message+aggregationMSG可以是一个线性变换,注意hvl{h_v}^lhvl利用了v结点本身的信息。经典的GCNLayers:这里的hvlh_v^lhvl没有利用hvl−1h_v^{l-1}hvl−1的信息,下一种方法GraphSAGE进行了改进,把hN(v)lh_{N(v)}^lhN(v)l的信息与hvl−1h_v^{l-1}hvl−1的信息连接起来,这里的concat
fVector
·
2023-01-08 19:06
图神经网络
神经网络
深度学习
[基础论文阅读]QMIX: Monotonic Value Function Factorization for Deep Multi-agent Reinforcement Learning
基础论文阅读]QMIX:MonotonicValueFunctionFactorizationforDeepMulti-agentReinforcementLearning题目含义:QMIX:用于多智能体
深度强化学习
的单调值函数分解文章来源
非著名科研萌新
·
2023-01-08 10:20
论文阅读
系统辨识
课程笔记
第一次课现代控制理论有哪些部分组成辨识、状态估计、控制理论辨识方法主要采用什么技术数理统计的技术系统辨识的定义系统辨识是根据系统的输入/输出时间函数,确定系统行为的数学模型,是现代控制理论的一个分支。辨识模型具有(近似)性、(唯一)性,辨识方法亦有(多样)性。辨识采用的测量数据的特点是什么有噪声,有随机性辨识方法的分类经典辨识方法(非参数辨识):阶跃相应辨识方法、脉冲相应辨识方法、频率相应辨识方法
mez_Blog
·
2023-01-08 07:44
mez_Blog的专栏
1024程序员节
系统辨识
课程笔记
深度学习
课程笔记
——回归、精灵宝可梦案例
目录1RegressionCase1.1CurrentCase1.1.1Senario1.1.2Task2RegressionSteps2.1DesignAModel2.2GoodnessOfFunction2.2.1ErrorSurface2.3BestFunction2.3.1GradientDescent3ModelSelection4RedesignTheModel4.1Backtoste
chelsea_tongtong
·
2023-01-08 07:38
深度学习
tensorflow
深度学习
机器学习
python
【人人可学的AI】策略蒸馏
什么是策略蒸馏策略蒸馏(PolicyDistillation)是一种将大型
深度强化学习
模型的行为转化为更简单的、轻量级的模型的方法。
欧阳枫落
·
2023-01-07 21:53
深度学习
人工智能
人工智能
深度学习
算法
【深度学习】李宏毅2021/2022春深度学习
课程笔记
- (Multi-Head)Self-Attention (多头)自注意力机制 + Pytorch代码实现
文章目录一、序列标注二、全连接神经网络三、Window四、Self-Attention自注意力机制4.1简介4.2运行原理4.3QKV五、Multi-HeadSelf-Attention多头注意力机制5.1运算原理5.2PositionalEncoding六、其他应用6.1语音识别6.2图像处理6.3CNN与Self-Attention的比较6.4RNN与Self-Attention的比较6.5S
WSKH0929
·
2023-01-07 09:09
#
深度学习
人工智能
深度学习
Self-Attention
多头自注意力机制
Pytorch
算法
深度学习-策略学习
学之前的基础:1.强化学习专业名词解释2.价值学习图片来源:【王树森】
深度强化学习
policy-basedreinforcementlearning(策略学习):用神经网络近似策略函数,叫策略网络,用于控制
perfect_god
·
2023-01-07 08:25
深度学习和机器学习
深度学习
机器学习
人工智能
算法
actor-critic methods(价值学习和策略学习的结合)
在此之前,请先了解:1.深度学习专业名词解释2.深度学习-价值学习3.深度学习-策略学习图片来源:【王树森】
深度强化学习
Actor-CriticMethods:actor是策略网络,用来控制agent运动
perfect_god
·
2023-01-07 08:25
深度学习和机器学习
深度学习
神经网络
人工智能
【深度学习】04-01-自注意力机制(Self-attention)-李宏毅老师21&22深度学习
课程笔记
04-01-自注意力机制Self-attention模型输入文字处理语音处理Graph模型输出类型一:一对一(SequenceLabeling)类型二:多对一类型三:多对多(由模型自定seq2seq)一对一类型:序列标注问题-无上下文信息序列标注问题-解决方法一:滑动窗口相邻向量信息序列标注问题-解决方法二:Self-attentionSelf-attention如何保证每个输出都能分析所有输入上
暖焱
·
2023-01-06 20:24
#
深度学习-李宏毅
深度学习
人工智能
机器学习
【深度学习】李宏毅2021/2022春深度学习
课程笔记
- 各式各样神奇的自注意力机制(Self-Attention)变型
文章目录一、Self-Attention各式各样的变型二、Howtomakeself-attentionefficient?三、Notice四、LocalAttention/TruncatedAttention五、StrideAttention六、GlobalAttention七、ManyDifferentChoices八、CanweonlyfocusonCriticalParts?8.1Clus
WSKH0929
·
2023-01-06 20:21
#
深度学习
人工智能
深度学习
人工智能
算法
注意力机制
自注意力机制
Transformer由来——A Tutorial of Transformers
课程笔记
邱锡鹏老师在B站上的Transformer课程将Transformer的来历讲的非常清楚,可谓Transformer最佳答疑解惑。本篇记录下课程的一些笔记和思考,欢迎大家讨论。参考资料:1.Transformers课程:https://www.bilibili.com/video/BV1sU4y1G7CN/2,论文:"Attentionisallyouneed."https://arxiv.org
Eva_Hua
·
2023-01-06 13:52
Deep
Learning
transformer
深度学习
自然语言处理
项目经理是怎样炼成的?
课程笔记
项目经理是怎样炼成的?
静尾
·
2023-01-06 13:05
项目管理
pmp
PM
多任务
深度强化学习
入门
理论概述多任务
深度强化学习
,英文Multi-TaskDeepReinforcementLearning,简称MTDRL或MTRL。
微笑小星
·
2023-01-06 07:09
强化学习
强化学习
上一页
30
31
32
33
34
35
36
37
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他