E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
强化学习文献阅读
自动驾驶预测-决策-规划-控制学习(4):预测分析
文献阅读
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、摘要分析1.Transformer模型是什么?什么是自注意力机制?2.数据集是什么?3.预测车辆行驶轨迹和车辆换道意图4.LSTM网络二、神经网络概述1.人工智能是什么?2.机器学习是什么?3.深度学习是什么?4.神经网络是什么?一个最简单的神经网络模型神经网络可以理解为一个分类器,通过训练后,能够记住我们人为需要的一
棉花糖永远滴神
·
2024-01-07 06:11
自动驾驶
学习
人工智能
自动驾驶感知-预测-决策-规划-控制学习(3):感知方向
文献阅读
笔记
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、文章主题二、摘要阅读1.名词理解①点云是什么?②二维图像分割器③轻量化卷积网络提取特征④单模态表达和多模态特征融合的区别⑤基于ROS的多传感器融合感知⑥TensorRT工具2.总结摘要三、绪论解析1.首先分析了车道线检测方面有三类工作2.又分析了三维目标检测研究的三类工作3.综述各章节内容四、硬件与软件设计1.总体方案
棉花糖永远滴神
·
2024-01-07 06:41
自动驾驶
学习
笔记
Actor-Critic 跑 CartPole-v1
Vπθ(st)\psi_t=r_t+\gammaV_{\pi_\theta}(s_{t+1})-V_{\pi_\theta}({s_t})ψt=rt+γVπθ(st+1)−Vπθ(st)详细请参考动手学
强化学习
简单来说就是
NoahBBQ
·
2024-01-06 17:17
RL
pytorch
gym
actor-critic
CartPole-v1
ChatGPT 原来是这样工作的(下)
从人类的反馈中进行
强化学习
ReinforcementLearningfromHumanFeedback方法总体包括三个不同的步骤:有监督的调优预训练的语言模型在相对少量
城北楠哥
·
2024-01-06 15:45
[
文献阅读
报告]:Take-over Time Prediction for Autonomous Driving in the Real-World: Robust Models, Data Aug
[
文献阅读
报告]:Take-overTimePredictionforAutonomousDrivingintheReal-World:RobustModels,DataAugmentation,andEvaluation
Way_X
·
2024-01-06 12:33
文献阅读报告
人工智能
深度学习
算法
自动驾驶
【实践】Angel深度学习在广告推荐训练优化中的实践.pdf(附下载链接)
2、从零开始搭建创业公司后台技术栈3、全民K歌推荐系统算法、架构及后台实现4、微博推荐算法实践与机器学习平台演进5、腾讯PCG推荐系统应用实践6、
强化学习
算法在京东广告序列推荐场景的应用7、飞猪信息流内容推荐探索
智能推荐系统
·
2024-01-06 12:25
算法
腾讯
python
人工智能
机器学习
2023/12/17周报
文章目录摘要Abstract
文献阅读
1题目2解决问题3引言4方法4.1SymbolicDescription4.2TheShort-TermMemoryPriorityModel4.3TheSTAMPModel4.4TheShort-TermMemoryOnlyModel5
user_s1
·
2024-01-06 07:25
深度学习
人工智能
2023/12/31周报
文章目录摘要Abstract
文献阅读
题目引言模型与方法多层感知器神经网络MLPLSTMGRUAE-BiGRU-Swish神经网络实验实验过程评估标准实验结果深度学习Self-attention背景作用实现方式简单
user_s1
·
2024-01-06 07:25
机器学习
2023/12/24周报
文章目录摘要Abstract
文献阅读
1.题目2.创新点3.方法3.1降水临近预报问题的表述3.2序列建模的长短期记忆4.模型4.1卷积LSTM4.2将2D图像转换为3D张量4.3Encoding-forecasting5
user_s1
·
2024-01-06 07:54
深度学习
人工智能
机器学习
2024/1/7周报
文章目录摘要Abstract
文献阅读
题目引言贡献相关工作TemporalRecommendationSequentialRecommendation方法ProblemFormulationInputEmbeddingSelf-AttentionStructureModelTraining
user_s1
·
2024-01-06 07:19
逻辑回归
深度学习
lstm
人工智能
【MLOps】使用Ray缩放AI
在这里,我将介绍Ray,并介绍如何使用Ray扩展大型语言模型(LLM)和
强化学习
(RL),然
架构师研究会
·
2024-01-06 01:59
MLOps
人工智能
IT运维
人工智能
Ray
MLops
第10天
强化学习
:6月9日厥阴病篇吕文珍总结
1,厥阴病第一个特点是寒气往下掉,热气往上面冲,既上焦上火、下焦寒的状态,寒热错杂。厥、热互打,厥胜一场热胜一场。正如张仲景提出,如果这个人得厥阴病,会发高烧,然后燥热,五六日后手脚冰冷,拉肚子五六日。这样热几天冷几天,热几天冷几天。厥热胜复。2,厥阴第二个特点:情志性格问题。就是现在的人都好辩,有一个好辩的头脑!好辩的是实非常伤一个人的厥阴风木之气。那种情绪问题很多,控制欲非常强的那种肝实的人得
吕文珍520
·
2024-01-05 22:03
04 supervised learning
unspervisedlearningclustering(聚类算法)Anomalydetection(异常检测)RecommenderSystems(推荐系统)ReinforcementLearning(
强化学习
叮咚Zz
·
2024-01-05 14:39
深度学习
机器学习
目标检测
人工智能
麻黄升麻汤与干姜芩连人参汤90天
强化学习
–周丹
麻黄升麻汤。伤寒六七日,大下后,寸脉沉而迟,手足厥逆,下部脉不至,咽喉不利,唾脓血,泄利不止者,为难治,人参附子汤主之。不差,复以人参干姜汤与之。人参附子汤方。人参二两附子一枚干姜二枚(炮)半夏半升阿胶二两柏叶三两右六味,以水六升,煮取二升,去滓,纳胶烊消。温服一升,日再服人参干姜汤方。人参二两附子一枚干姜三两桂枝二两(去皮)炙草二两(炙)右五味,以水二升,煮取一升,去滓。温顿服之。伤寒四五日,腹
经方临证经验录
·
2024-01-05 13:59
深度学习 | 多模态算法
一、InstructGPT模型1、GPT系列回顾chatGPT和InstructGPT都使用了指示学习和基于人工反馈的
强化学习
来指导模型的训练,不同点仅仅是在采集数据的方式上有所差异。
西皮呦
·
2024-01-04 22:49
深度学习
人工智能
优势演员-评论家算法 A2C
优势演员-评论家算法A2C优势演员-评论家算法A2C主要思想目标函数优势演员-评论家算法A2C前置知识:演员-评论家算法:多智能体
强化学习
核心框架主要思想AC网络结构:策略网络-演员:这个网络负责根据当前的状态选择动作
Debroon
·
2024-01-04 21:46
#
强化学习
算法
2019年上半年收集到的人工智能迁移学习干货文章
2019年上半年收集到的人工智能迁移学习干货文章迁移学习全面指南:概念、项目实战、优势、挑战迁移学习:该做的和不该做的事深度学习不得不会的迁移学习TransferLearning谷歌最新的PlaNet对
强化学习
以及迁移学习的意义及启发迁移学习时间序列分类如何提高
强化学习
的可靠性
城市中迷途小书童
·
2024-01-04 20:11
【深度学习:(Contrastive Learning) 对比学习】深入浅出讲解对比学习
这种方法已被证明在计算机视觉、自然语言处理(NLP)和
强化学习
等不同领域都是有效的。
jcfszxc
·
2024-01-04 14:08
深度学习知识专栏
深度学习
学习
人工智能
文献阅读
-计算机
中国计算机学会:CCF推荐国际学术刊物目录-中国计算机学会顶会:小绿鲸:zotero联动小绿鲸,研究生读英文文献更爽啦_哔哩哔哩_bilibiliWebofScience:要有学校登录【研究生】手把手教你使用WebofScience_哔哩哔哩_bilibili查看顶刊顶会如何快速找到本领域顶刊论文?避免组会被骂!_哔哩哔哩_bilibili
pythonSuperman
·
2024-01-04 12:48
论文
强化学习
:PPO
PPO简介我们在之前的项目中介绍了基于价值的
强化学习
算法DQN,基于策略的
强化学习
算法REINFORCE,基于价值和策略的组合算法Actor-Critic.对于基于策略分方法:参数化智能体的策略,并设计衡量策略好坏的目标函数
人工智能MOS
·
2024-01-04 06:58
神经网络
人工智能
深度学习
机器学习
PPO
Gym
强化学习
自定义环境的搭建
Gym介绍Gym是一个用于测试和比较
强化学习
算法的工具包,它不依赖
强化学习
算法结构,并且可以使用很多方法对它进行调用,像Tensorflow、Theano。
棋圣阳阳阳
·
2024-01-04 06:25
Python
强化学习
Flexsim
python
深度学习
李宏毅机器学习第二十二周周报GAN理论2
week22TheorybehindGAN2摘要Abstract一、李宏毅机器学习0.上周内容概述1.GAN的训练过程2.生成器与分辨器的算法细节3.整体算法描述4.原文中生成器目标函数的实现方式二、
文献阅读
沽漓酒江
·
2024-01-03 22:48
机器学习
生成对抗网络
人工智能
李宏毅机器学习第二十周周报GAN4
文章目录week20GAN4摘要Abstract一、李宏毅机器学习——GAN41.LearningfromUnpairedData2.CycleGAN3.Application二、
文献阅读
1.题目2.abstract3
沽漓酒江
·
2024-01-03 22:18
机器学习
人工智能
李宏毅机器学习第二十一周周报GAN理论
week21TheorybehindGAN摘要Abstract一、李宏毅机器学习——TheorybehindGAN1.Generation2.最大似然估计3.Generator3.Discriminator二、
文献阅读
沽漓酒江
·
2024-01-03 22:18
机器学习
生成对抗网络
人工智能
李宏毅机器学习第十八周周报GAN2
文章目录week18GAN2摘要Abstract一、TheorybehindGAN1.训练目的2.Wassersteindistance二、
文献阅读
1.题目2.abstract3.网络架构3.1WassersteinDistance3.2WasserteinGANs3.3Gradientpenalty4
沽漓酒江
·
2024-01-03 22:47
机器学习
人工智能
李宏毅机器学习第十九周周报GAN3
一、李宏毅机器学习——GAN31.Introduce2.DifficultyinGANtraining3.EvaluationofGeneration4.ConditionalGeneration二、
文献阅读
沽漓酒江
·
2024-01-03 22:47
机器学习
人工智能
gan
李宏毅机器学习第二十三周周报 Flow-based model
Abstract一、李宏毅机器学习1.引言2.数学背景2.1Jacobian2.2Determinant2.3ChangeofVariableTheorem3.Flow-basedModel4.GLOW二、
文献阅读
沽漓酒江
·
2024-01-03 22:15
机器学习
人工智能
生成对抗网络
【伤寒
强化学习
训练】打卡第八十五天 一期90天
9.9.1-黄芩汤证与黄连汤证太少并病治禁【8.49】太阳少阳并病,心下鞕,颈项强而眩者,当刺大椎、肺俞、肝俞,慎不可下也,下之则痉。太阳少阳并病,心下硬,颈项强而眩,基本上是太阳少阳的邪气从太阳要转归到少阳的过程里面会有这样的状况;张仲景的书有时候会让人读到一个事情,就是觉得好像汉朝人的津液是不是比我们现代的人少,张仲景叫大家小心的某一些津液不足的状况,因为津液不足而造成的颈项强,他的主张是非常
A卐炏澬焚
·
2024-01-03 21:47
Deep Q-Network (DQN)理解
DQN(DeepQ-Network)是深度
强化学习
(DeepReinforcementLearning)的开山之作,将深度学习引入
强化学习
中,构建了Perception到Decision的End-to-end
兔兔爱学习兔兔爱学习
·
2024-01-03 20:59
python
机器学习
深度学习
学习
机器学习笔记三——
强化学习
的V值计算
一、蒙特卡诺采样回溯计算V值把智能体放入环境的任意状态——从这个状态开始按照策略进行动作选择,并进入新状态——重复步骤2,直至进入最终状态——从最终状态往前回溯,计算每个状态的G值——重复1~4状态多次,平均每个状态的G值,这就是所需的V值1.具体G值计算如下:按照策略往后走,过程中不进行计算,只记录每一步的奖惩r从终点往前走,到某一状态获得的奖励总和就是G值。此时G=r+gamma*G_1,即这
唐豆豆*
·
2024-01-03 15:09
机器学习
算法
机器学习
2024人工智能发展方向(机器人领域)
尽管离完全实现还尚有距离,但新年伊始,也是一个新的台阶,结合2023年的成果,在此基础上,2024年在算法架构上会倾向于,让机器人具有不断进化的能力,这一点李飞飞早在2021年便提出了深度
强化学习
进化策略
笑傲江湖2023
·
2024-01-03 11:21
机器人
机器学习笔记二——
强化学习
一、什么是
强化学习
强化学习
就是让智能体可以独立自主的完成某个任务。独立自主指的就是不需要人去指挥。比如扫地机器人,打开开关就会自动去清理。自动驾驶的汽车,在定好目的地后,可以自动安全达到目的地。
唐豆豆*
·
2024-01-03 08:26
机器学习
笔记
机器人
机器学习
Python贪心算法(Kruskal算法)生成对抗网络和
强化学习
数据集(计算机视觉)
最小生成树生成树被定义为包含图的所有顶点的连通无向图的树状子图。或者,用外行的话来说,它是形成一棵树(无环)的图的边的子集,其中图的每个节点都是树的一部分。最小生成树具有生成树的所有属性,并附加了在所有可能的生成树中具有最小可能权重的约束。与生成树一样,图也可以有许多可能的MST。生成树属性:图和生成树中的顶点数(V)相同生成树中有固定数量的边,该数量等于顶点总数减一(E=V-1)生成树不应断开连
亚图跨际
·
2024-01-03 08:41
算法
Python
算法
python
贪心算法
2019年4月阅读计划
正好今天刚刚看了夏鹏老师的公众号推文,谈到
文献阅读
,说最重要的就是去读,其次还要:1.有学术带路人。这一点非常感谢外研社提供的平台,不仅有小伙伴一起读,还有专家老师来答疑解惑
叶小静Stamy
·
2024-01-03 07:48
论文阅读--Behavior Proximal Policy Optimization
YilangGuo论文链接:http://arxiv.org/abs/2302.11312arXiv2023-02-22代码链接:https://github.com/Dragon-Zhuang/BPPO摘要离线
强化学习
酒饮微醉-
·
2024-01-03 04:44
强化学习
论文阅读
学习
机器学习
强化学习
Q-Learning基本原理
【AI业余爱好者学习总结】看了好多资料觉得Q-Learning很绕看不明白,猛刷B站几个视频,终于略懂一二。其中我觉得最通俗易懂的是几个大一学生讲的课程PPT,在这里总结一下。(【小组作业】Q-learning简单介绍_哔哩哔哩_bilibili)首先是Q-Learning的原理:Q-Learning就是想要得到最优的动作价值函数。上面表格中,每一行是一种状态,每一列是在这种状态下的行为对应的价值
xcpppig
·
2024-01-03 01:24
机器学习
人工智能
【多传感器融合导航论文阅读】
多传感器融合导航论文积累知识点总结因子图一致因子图
文献阅读
笔记[IF18.6]知识点总结因子图FactorGraph是概率图的一种,是对函数因子分解的表示图,一般内含两种节点,变量节点和函数节点。
今天我刷leetcode了吗
·
2024-01-02 04:42
论文阅读
学习方法
服务运营 | 年终回顾:服务运营为您服务
在此基础上,我们的原创推文主要涉及(1)混合整数规划(2)排队论(3)马尔科夫决策(
强化学习
)三个方向在医疗优化中的应用建模。基于消费者
运筹OR帷幄
·
2024-01-02 02:41
人工智能
机器学习的分类与经典算法
机器学习算法按照学习方式分类,可以分为有监督学习(SupervisedLearning)、无监督学习(UnsupervisedLearning)、半监督学习(Semi-supervisedLearning)、
强化学习
RainTicking
·
2024-01-02 02:31
机器学习
机器学习
算法
机械学习 - 基础概念 - scikit-learn - 数据预处理 - 1
2.关于模型的概念一、机械学习概念1.监督学习总结:2.非监督学习总结:3.
强化学习
总结:三种学习的特点总结scikit-learn说明二、机械学习的基本实操逻辑1.采集数据2.数据预处理(Preprocessing
沐 修
·
2024-01-01 23:37
机器学习
scikit-learn
python
机器学习
博士课堂开讲啦之三十丨科研小白如何进行文献管理?
第三十讲丨文献管理技巧LectureThirty丨technique
文献阅读
的重要性自是不必多说,但是在具体阅读过程中,文献太多导致目录混乱,重复引用,行动迟缓,效率很低,尤其是读书笔记总是东写一点西写一点
21b192e70cf3
·
2024-01-01 21:21
文献阅读
--Σ-Δ 小数频率合成器原理
参考文献本文为阅读相关论文后的笔记。不同类型的频率合成器有不同的优缺点,本文主要是对PLLFS的Σ-Δ小数频率综合器的原理进行记录学习。论文:[1]刘宝宝.Sigma-Delta小数频率综合器中小数分频器研究与设计[D].华侨大学,2012.[2]梁佳琦.高精度Σ-Δ小数分频器的研究与设计[D].中国运载火箭技术研究院,2022.DOI:10.27096/d.cnki.ghtdy.2022.000
伊丽莎白鹅
·
2024-01-01 17:40
文献阅读
学习
LMX2571 芯片配置Verliog SPI驱动
TICSPro配置时钟芯片
文献阅读
–Σ-Δ小数频率合成器原理LMX2571芯片数据手册一、LMX2571配置时序分析1.1写时序 LMX2571使用24位寄存器进行编程。
伊丽莎白鹅
·
2024-01-01 17:09
ZYNQ学习笔记
fpga开发
第二十五周:
文献阅读
笔记(swin transformer)
第二十五周:
文献阅读
笔记(swintransformer)摘要Abstract1.swintransformer文献笔记1.1.文献摘要1.2.引言1.3.SwinTransformer原理1.3.1.
@默然
·
2024-01-01 16:53
笔记
transformer
深度学习
人工智能
机器学习
第二十四周:
文献阅读
笔记(VIT)
第二十四周:
文献阅读
笔记摘要Abstract1.
文献阅读
1.1文献题目1.2文献摘要1.3引言1.4VIT1.4.1Embedding层结构详解1.4.2BN和LN算法1.4.3TransformerEncoder
@默然
·
2024-01-01 16:53
笔记
用一个小游戏入门深度
强化学习
今天我们来用深度
强化学习
算法deepQ-learning玩CartPole游戏。
不会停的蜗牛
·
2024-01-01 13:54
大家都在用的AI作画Python几行代码就可实现
一、通过openai实现的作品:要想快速实现功能,咱们先了解一下OpenAI,OpenAI是一家人工智能公司,专注于开发
强化学习
、机器学习、自然语言处理等技术。
馒头糕饼一齐要
·
2024-01-01 08:50
python
ai
人工智能
【伤寒
强化学习
训练】打卡第八十九天 一期90天
9.10.1-阳明病证候阳明病经证脾胃的湿气堆起来之后,直接就是脾阴实传到心阴实,祛湿的药,平胃散,要顺便减肥吃大豆黄卷,五苓散证就吃五苓散;如果已经转成胸闷状态,脾阴实传成心阴实胸闷胸刺痛,胸口积太多的痰,不是瓣膜病,用栝蒌薤白半夏汤证;【9.12】阳明中风,口苦,咽干,腹满,微喘,发热,恶风,脉浮而缓,若下之,则腹满,小便难也。当这个人还有恶风脉浮缓的状态的时候,代表这个人的邪气还在表,还没有
A卐炏澬焚
·
2024-01-01 07:03
多任务学习简介
学院:电子工程学院转载于:微信公众号“AI部落联盟”’原文链接:https://mp.weixin.qq.com/s/hbtrijHy2E177fA7oe7SSA【嵌牛导读】多任务学习在NLP、CV和
强化学习
领域得到了很好的应用
5c36a4bce64b
·
2024-01-01 07:56
【自然语言处理】【大模型】 ΨPO:一个理解人类偏好学习的统一理论框架
AGeneralTheoreticalParadiamtoUnderstandLearningfromHumanPreferences》论文地址:https://arxiv.org/pdf/2310.12036.pdf相关博客【自然语言处理】【大模型】ΨPO:一个理解人类偏好学习的统一理论框架【
强化学习
BQW_
·
2024-01-01 05:47
自然语言处理
自然语言处理
RLHF
偏好对齐
大模型
LLM
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他