E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
强化学习文献阅读
一对一包教会脑电教学服务
想
强化学习
脑电某个内容版块可以吗?...”,也有小伙伴联系我们,咨询脑电相关内容能
茗创科技
·
2024-01-27 16:03
用ChatGPT写申请文书写进常春藤联盟?
该程序使用基于GPT-3.5、GPT-4架构的大型语言模型并以
强化学习
训练。ChatGPT目前仍以文字
do1twe11
·
2024-01-27 10:33
chatgpt
人工智能
机器学习周记(第二十五周:
文献阅读
-DSTIGNN)2024.1.8~2024.1.14
目录摘要ABSTRACT1论文标题2论文摘要3论文背景4过去研究5论文研究5.1问题描述5.2论文模型5.2.1时空交互学习模块(SpatiotemporalInteractiveLearningModule)5.2.2动态图推理模块(DynamicGraphInferenceModule)5.2.3动态图卷积模块(DynamicGraphConvolutionModule)5.2.4输出模块与训
Slender2001
·
2024-01-27 08:14
机器学习
人工智能
深度学习
神经网络
cnn
gru
回归
机器学习周记(第十九周:
文献阅读
-TCN and RNN)2023.11.27~2023.12.3
目录摘要ABSTRACT1论文标题2论文摘要3问题描述4过去方案5论文方案5.1时间卷积神经网络(TCN)5.1.1因果卷积(CausalConvolutions)5.1.2膨胀卷积(DilatedConvolutions)5.1.3残差块(ResidualBlock)5.2论文模型5.3数据集5.3.1Lorenz系统5.3.2Rössler系统5.3.3类Lorenz系统6相关代码摘要本周阅读
Slender2001
·
2024-01-27 08:43
机器学习
深度学习
人工智能
神经网络
pytorch
回归
dnn
机器学习周记(第二十四周:
文献阅读
-DSTGN续)2024.1.1~2024.1.7
目录摘要ABSTRACT1动态图矩阵估计(DynamicGraphMatrixEstimation,DGME)2自适应导引传播(AdaptiveGuidedPropagation,AGP)2.1引导矩阵估计器(GuideMatrixEstimator)2.2自适应传播(AdaptivelyPropagation)3时间卷积模块(TemporalConvolutionModule)4优化目标(Opt
Slender2001
·
2024-01-27 08:43
机器学习
人工智能
算法
深度学习
神经网络
回归
图论
机器学习周记(第二十三周:
文献阅读
-DSTGN)2023.12.25~2023.12.31
目录摘要ABSTRACT1论文标题2论文摘要3论文背景4问题描述4.1图的定义4.2图信号矩阵的定义4.3问题的定义5论文模型6相关代码摘要本周阅读了一篇关于GNN用于多元时间序列的时空预测的文章,文章的模型是一个具有自适应传播机制的动态时空图网络(dynamicspatio-temporalgraphnetworkwithadaptivepropagationmechanism,DSTGN),该
Slender2001
·
2024-01-27 08:13
机器学习
人工智能
深度学习
神经网络
cnn
pytorch
回归
机器学习周记(第十八周:GAN.pt3)2023.11.20~2023.11.26
目录摘要ABSTRACT1
文献阅读
2生成结果多样性判别(Diversity)3生成结果多样性判别(FrechetInceptionDistance(FID))4条件对抗生成网络(ConditionalGAN
Slender2001
·
2024-01-27 08:12
机器学习
生成对抗网络
人工智能
深度学习
神经网络
lstm
回归
机器学习周记(第二十周:
文献阅读
-TCN and LSTM)2023.12.4~2023.12.10
目录摘要ABSTRACT1论文标题2论文摘要3问题描述4过去方案5论文方案6相关代码摘要本周阅读了一篇关于TCN和LSTM进行光伏功率预测的文章,光伏功率数据是非线性不平稳的数据,在一定程度上也能反应论文模型在水质预测方面的效果。论文模型可以通过单步或者多步对光伏功率进行预测,实验结果表明,其具有非常优异的表现。本周也针对论文模型进行了简单的复现,预测结果并不非常准确,仍需进一步优化和调参。ABS
Slender2001
·
2024-01-27 08:12
机器学习
人工智能
深度学习
神经网络
cnn
pytorch
回归
机器学习周记(第二十七周:
文献阅读
-EIGRN)2024.1.22~2024.1.28
目录摘要ABSTRACT1论文信息1.1论文标题1.2论文摘要1.3论文背景2论文研究2.1问题描述2.2基准模型2.3论文模型3模型模块3.1图生成(graphgeneration)3.1.1显式图生成模块(explicitgraphgenerationmodule)3.1.2隐式图生成模块(implicitgraphgenerationmodule)3.2邻居聚合(neighboraggreg
Slender2001
·
2024-01-27 08:40
人工智能
机器学习
深度学习
神经网络
cnn
rnn
回归
D4RL的踩坑记录
的库函数时用了env.get_normalized_score这里遇到的问题是envhasnoattributeget_normalized_score后记D4RL的用法指南D4RL本质上是一个数据库,用于离线的
强化学习
SRTTTTT
·
2024-01-27 05:04
python
对小工蚁关于LLM的技术总结+个人思考
1.blog/trl-peft.mdatmain·huggingface/blog·GitHub2.基于
强化学习
的微调(这个挺好)微软发布的文本生成增强框架DTG,让LLM主动思考和生成能力提升[2305.1
河南-殷志强
·
2024-01-27 02:57
人工智能之数据与语言
笔记
chatgpt
人工智能
深度学习
python
学习
AI虚拟女友一个月能赚3万美金,引发关注和疑惑;最新 Hugging Face
强化学习
课程(中文版)来啦
AI新闻AI虚拟女友一个月能赚3万美金,引发关注和疑惑摘要:一家英国的AI公司公布了他们的虚拟女友带来的实际产出数字:一个月能赚取3万美金(约合人民币21.4万元)。这引起了网友的惊叹和疑惑,因为AI女友只是微调一个图像算法,但却能每月赚取半年工资。据说除了赚钱,AI女友每月还收到多达20个求婚。这款AI女友被称为LexiLove,由FoxyAI公司创建,能够24小时全天候提供陪伴和聊天,甚至以超
go2coding
·
2024-01-27 02:43
AI日报
人工智能
如何用
强化学习
优化广告投放中的A/B Test
公众号后台回复“图书“,了解更多号主新书内容作者:会痛的stone来源:R语言工程化A/BTest是决策科学的最常见方法之一。以广告投放为例,将客户群分为两组或多组,每组群体展示不同的广告形式。在测试结束时,针对测试结果选择最优的形式做大量投放。然而A/Btest有个很大的弊端,即一定程度上影响了部分用户的体验。尤其在测试内容存在极好、极差的情况下。如果只有一个A/Btest,那么成本可能是可控的
IT农民工1
·
2024-01-26 21:54
算法
人工智能
python
大数据
机器学习
XGBoost系列8——XGBoost的未来:从
强化学习
到AutoML
目录写在开头1.XGBoost在
强化学习
中的应用1.1构建
强化学习
问题1.2XGBoost与深度
强化学习
的对比1.3实际任务中的成功案例2.XGBoost与AutoML的结合2.1XGBoost在自动特征工程中的应用
theskylife
·
2024-01-26 21:21
数据挖掘
人工智能
机器学习
数据挖掘
XGboost
python
深度学习与图像描述生成——看图说话(3)
目录一、整体架构二、学习策略2.1监督学习2.2无监督学习2.3
强化学习
三、特征映射3.1定义3.2原理3.3关键技术3.4重要案例3.5特别注意下特征空间这一概念四、语言模型4.1定义与原理4.2关键技术
giszz
·
2024-01-26 11:48
人工智能
深度学习
人工智能
Hierarchical Object Detectionwith Deep Reinforcement Learning
摘要我们提出了一种方法,在深度
强化学习
agent引导的图像中执行层次对象检测。其关键思想是关注图像中包含更丰富信息的部分,并将其放大。
fayetdd
·
2024-01-26 09:16
目标检测
人工智能
计算机视觉
ReinforceNet: A reinforcement learning embedded object detectionframework with region selection net
强化学习
嵌入式目标检测框架与区域选择网络摘要摘要近年来,研究人员探索了基于
强化学习
的目标检测方法。然而,现有的方法总是难以令人满意的性能。
fayetdd
·
2024-01-26 09:45
目标检测
计算机视觉
深度学习
强化学习
- Policy Gradient Methods(策略梯度方法)
什么是机器学习策略梯度方法(PolicyGradientMethods)是一类用于解决
强化学习
问题的算法,其目标是直接学习策略函数,而不是值函数。
草明
·
2024-01-25 21:53
数据结构与算法
机器学习
人工智能
算法
深度学习
强化学习
- Deep Q Network (DQN)
什么是机器学习DeepQNetwork(DQN)是一种结合深度学习和
强化学习
的方法,用于解决离散动作空间的
强化学习
问题。
草明
·
2024-01-25 21:23
数据结构与算法
机器学习
人工智能
深度学习
算法
强化学习
- Q-learning(Q学习)
什么是机器学习
强化学习
中的Q-learning(Q学习)是一种用于学习在未知环境中做出决策的方法。它是基于值函数的方法,通过学习一个值函数Q,该函数表示在给定状态和动作下,期望的累积奖励。
草明
·
2024-01-25 21:52
数据结构与算法
学习
机器学习
人工智能
深度学习
深度
强化学习
-策略梯度及PPO算法-笔记(四)
策略梯度及PPO算法策略梯度PolicyGradient基础知识策略梯度的计算细节TipsTip1:AddaBaselineTip2:AssignSuitableCredit策略梯度优化的技巧Reinforce蒙特卡洛MC与时序差分TDReinforce算法PPO(ProximalPolicyOptimization)基础知识FromOn-policytoOff-policyImportanceS
wield_jjz
·
2024-01-25 14:03
学习笔记
强化学习
强化学习
--梯度策略
强化学习
强化学习
--梯度策略
强化学习
1Keywords2Questions1Keywordspolicy(策略):每一个actor中会有对应的策略,这个策略决定了actor的行为。
无盐薯片
·
2024-01-25 14:02
强化学习
python
机器学习
人工智能
Pytorch 实现
强化学习
策略梯度Reinforce算法
一、公式推导这里参考邱锡鹏大佬的《神经网络与深度学习》第三章进阶模型部分,链接《神经网络与深度学习》。`伪代码:二、核心代码defmain():env=gym.make('CartPole-v0')obs_n=env.observation_space.shape[0]act_n=env.action_space.nlogger.info('obs_n{},act_n{}'.format(obs_
爱喝咖啡的加菲猫
·
2024-01-25 14:31
强化学习
强化学习
神经网络
pytorch
【机器学习】
强化学习
(七)-策略梯度算法-REINFORCE 训练月球着陆器代理(智能体)...
概述月球着陆器代理是一个模拟飞行器在月球表面着陆的环境,它有八个连续的状态变量,分别是水平坐标、垂直坐标、水平速度、垂直速度、角度、角速度、腿1触地、腿2触地。它有四个离散的动作,分别是什么都不做、发动左方向引擎、发动主引擎、发动右方向引擎。训练月球着陆器代理的目标是使飞行器能够安全地降落在两个黄色旗帜之间的停机坪上,最小化燃料消耗和着陆时间。为了实现这个目标,我们可以用策略梯度算法来训练一个神经
十年一梦实验室
·
2024-01-25 14:25
机器学习
算法
人工智能
文献阅读
-2022-11-23-RNA结构-5'UTR的review
题目:2018_Functional5′UTRmRNAstructuresineukaryotictranslationregulationandhowtofindthem摘要:RNA分子能折叠成复杂的形状,调控基因表达。这篇综述中,我们谈论,目前真核生物中5'UTR结构的机制理解,以及现有的探测5’UTR结构的方法。这些结构能通过RNA结构中螺旋介导的重塑和高级的RNA互作来调控依赖帽子的翻译起
不学无术吗
·
2024-01-25 13:53
[晓理紫]每日论文分享(有中文摘要,源码或项目地址)--机器人、
强化学习
、开放词汇
分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能,机器人
强化学习
开放词汇,检测分割==roboticagent==标题:TheConversationistheCommand:InteractingwithReal-WorldAuto
晓理紫
·
2024-01-25 13:01
每日论文
机器人
[晓理紫]每日论文分享(有中文摘要,源码或项目地址)--大模型、扩散模型、视觉导航
分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能,机器人
强化学习
开放词汇,检测分割==chatgpt@largelanguagemodel@LLM==标题:HAZARDChallenge:EmbodiedDecisionMakingi
晓理紫
·
2024-01-25 13:01
每日论文
人工智能
深度学习
机器学习
[晓理紫]每日论文分享(有中文摘要,源码或项目地址)-大模型、扩散模型、视觉导航
分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能,机器人
强化学习
开放词汇,检测分割==LLM==标题:MindYourFormat:TowardsConsistentEvaluationofIn-ContextLearningImpr
晓理紫
·
2024-01-25 12:31
每日论文
机器人
人工智能
机器学习
深度学习
[晓理紫]每日论文分享(有中文摘要,源码或项目地址)--机器人、
强化学习
分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能,机器人
强化学习
开放词汇,检测分割==roboticagent==标题:WorkspaceOptimizationTechniquestoImprovePredictionofHuman
晓理紫
·
2024-01-25 12:26
每日论文
机器人
深度学习
人工智能
机器学习
【机器学习】
强化学习
(六)-DQN(Deep Q-Learning)训练月球着陆器示例
概述DeepQ-Learning(深度Q学习)是一种
强化学习
算法,用于解决决策问题,其中代理(agent)通过学习在不同环境中采取行动来最大化累积奖励。
十年一梦实验室
·
2024-01-25 07:50
机器学习
人工智能
阅读记录:RNNLOGIC: LEARNING LOGIC RULES FOR REASON-ING ON KNOWLEDGE GRAPHS
现有方法要么面临在大搜索空间中搜索的问题(例如神经逻辑编程),要么由于奖励稀疏而导致优化无效(例如基于
强化学习
的技术)。为了解决这些限制,本文提出了一种称为RNNLogic的概率模型。
憨化龙猫
·
2024-01-25 07:04
论文阅读记录
知识图谱
人工智能
QTRAN算法总结
:LearningtoFactorizewithTransformationforCooperativeMulti-AgentReinforcementlearning参考文章:(35条消息)多智能体
强化学习
神奇的托尔巴拉德
·
2024-01-25 06:45
【
文献阅读
】 大模型增强的语言与知识推理
语言模型与知识图谱1语言模型推理与知识图谱推理1.1语言模型推理特性一:主要依靠神经网络在参数化空间完成,更多是一种隐式推理,缺乏可解释性。特性二:与模型规模具有强关联,只有模型参数达到一定规模,才能激活推理能力。特性三:大模型的泛化能力,基于指令驱动和反馈学习等机制实现。特性四:推理过程依赖生成过程,容易产生幻觉生成问题,导致推理结果缺乏可靠性。1.2知识图谱推理特性一:依靠显示获取的符号知识,
SuperCooper
·
2024-01-24 22:34
人工智能
知识图谱
【
文献阅读
】AutoMap:Diagnose Your Microservice-based Web Applications Automatically
论文链接AutoMap:DiagnoseYourMicroservice-basedWebApplicationsAutomatically前言(务必看一下~)最近查看故障相关论文,发现故障根因这一块在微服务中也有诸多涉及。微服务场景下各项服务也具有多项检测数据,服务之间的拓扑结构也是异常复杂。因此,希望通过这篇文章的思想来探究故障根因分析。但是,这篇出自2020年的文章,至今没有一篇文章对该论文
SuperCooper
·
2024-01-24 22:04
web
app
人工智能
知识图谱
【
文献阅读
】Harnessing Explanations LLM-to-LM Interprete for Enhanced TAG Graph Reresentation Learning
论文连接:HarnessingExplanations摘要背景:近年来,文本属性图(TAG)的表示学习已成为一个关键的研究问题。一个典型的案例是论文引用网络,其中每篇论文的文本作为节点属性,GNN将每篇论文将在这些文本属性转换为浅层特征,从而利用文本属性。问题:最近LLM大火,GPT和Lama2表现出推理和利用常识的能力。进一步,如何将这种文本建模能力与GNN的结构学习能力相结合成为突出性问题。贡
SuperCooper
·
2024-01-24 22:04
人工智能
gpt-3
【
文献阅读
】K-BERT Enabling Language Representation with Knowledge Graph
原文链接摘要指出问题:预训练的语言表示模型,例如BERT,从大规模的语料库中捕获通用的语言表示,但缺乏特定领域的知识。实际场景下:当专家阅读领域文本时,会利用相关知识进行推理。提出:一种带有KG的知识语言表示模型K-BERT。具体做法就是将KG中的三元组作为领域知识注入到句子当中。(三元组(知识特征)->句子(文本特征))问题:过多的知识融入会偏离句子的正确含义,这称之为知识噪声(KN)解决办法:
SuperCooper
·
2024-01-24 22:04
bert
知识图谱
人工智能
【
文献阅读
】ERNIE Enhanced Language Representation with Informative Entities
论文链接摘要背景:在大规模语料库上预训练的BERT等LR模型可以很好地从纯文本中捕获丰富地语义模式,并进行微调以持续提高各种NLP任务的性能。问题:现有的预训练语言模型(PLM)很少考虑结合KG,但是KG又能够提供丰富的结构化知识来更好地理解语言,所以作者认为知识图谱中的信息实体可以通过外部知识来增强语言的表示。(又是通过知识图谱来增强语言的特征表示)提出:作者认为知识图谱中的实体可以作为额外的知
SuperCooper
·
2024-01-24 22:04
知识图谱
人工智能
2019年上半年收集到的人工智能
强化学习
干货文章
2019年上半年收集到的人工智能
强化学习
干货文章从0到1-
强化学习
篇关于人工智能中
强化学习
的扫盲
强化学习
简介深度
强化学习
探索
强化学习
算法背后的思想起源!
强化学习
基础什么是
强化学习
?
城市中迷途小书童
·
2024-01-24 22:57
具有运动模糊的大规模场景的混合神经绘制
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录摘要Abstract
文献阅读
:具有运动模糊的大规模场景的混合神经绘制1、研究背景2、方法提出3、视点依赖归一化方法4、训练方法5、
qq_43314576
·
2024-01-24 19:15
深度学习
神经网络
计算机视觉
【
强化学习
】DQN、Double DQN、Dueling DQN、Per DQN、NoisyDQN 学习笔记
文章目录DQN(DeepQ-Network)说明伪代码应用范围DoubleDQN说明伪代码应用范围DuelingDQN实现原理应用范围伪代码PerDQN(PrioritizedExperienceReplayDQN)应用范围伪代码NoisyDQN伪代码应用范围部分内容与图片摘自:JoyRL、EasyRLDQN(DeepQ-Network)说明DQN通过深度学习技术处理高维状态空间,它的核心是使用深
如果皮卡会coding
·
2024-01-24 13:23
强化学习
强化学习
DQN
【
强化学习
】QAC、A2C、A3C学习笔记
强化学习
算法:QACvsA2CvsA3C引言经典的REINFORCE算法为我们提供了一种直接优化策略的方式,它通过梯度上升方法来寻找最优策略。
如果皮卡会coding
·
2024-01-24 13:52
强化学习
ActorCritic
QAC
A2C
A3C
跨文化能力研究的深化与西方范式面临的质疑
2019-03-083月
文献阅读
笔记07-《跨文化能力研究》时间:1990-1999机构成立:①国际跨文化研究院1997②国际语言与跨文化交际学会1999③中国跨文化交际学会1995研究主题:文化价值观
叶小静Stamy
·
2024-01-24 08:52
吴恩达机器学习介绍第一章介绍
机器学习可以分为监督学习、无监督学习和
强化学习
三种类型。在监督学习中,计算机系统通过使用带有标签的训练数据来学习模式和规律,然后根
清☆茶
·
2024-01-24 08:30
机器学习
人工智能
强化学习
12——策略梯度算法学习
Q-learning、DQN算法是基于价值的算法,通过学习值函数、根据值函数导出策略;而基于策略的算法,是直接显示地学习目标策略,策略梯度算法就是基于策略的算法。策略梯度介绍将策略描述为带有参数θ\thetaθ的连续函数,可以将策略学习的目标函数定义为:J(θ)=Es0[Vπθ(s0)]J(\theta)=\mathbb{E}_{s_0}[V^{\pi_\theta}(s_0)]J(θ)=Es0[
beiketaoerge
·
2024-01-24 06:46
强化学习
算法
学习
机器学习
强化学习
强化学习
11——DQN算法
DQN算法的全称为,DeepQ-Network,即在Q-learning算法的基础上引用深度神经网络来近似动作函数Q(s,a)Q(s,a)Q(s,a)。对于传统的Q-learning,当状态或动作数量特别大的时候,如处理一张图片,假设为210×160×3210×160×3210×160×3,共有256(210×60×3)256^{(210×60×3)}256(210×60×3)种状态,难以存储,但
beiketaoerge
·
2024-01-24 06:46
强化学习
算法
强化学习
强化学习
13——Actor-Critic算法
Actor-Critic算法结合了策略梯度和值函数的优点,我们将其分为两部分,Actor(策略网络)和Critic(价值网络)Actor与环境交互,在Critic价值函数的指导下使用策略梯度学习好的策略Critic通过Actor与环境交互收集的数据学习,得到一个价值函数,来判断当前状态哪些动作是好,哪些动作是坏,进而帮Actor进行策略更新。A2C算法AC算法的目的是为了消除策略梯度算法的高仿查问
beiketaoerge
·
2024-01-24 06:40
强化学习
算法
强化学习
2019-4-29晨间日记
读书改进:提高效率习惯养成:坚持周目标·完成进度力争完成学习·信息·阅读关注,查看健康·饮食·锻炼少盐,步行人际·家人·朋友和谐工作·思考积极,反思最美好的三件事1.学习2.读书3.看孩子思考·创意·未来
强化学习
木子化敏
·
2024-01-23 20:31
中医
强化学习
90天打卡第11天
厥阴病条文11.47至11.58讲解【11.47】厥阴之为病,消渴,气上撞心,心中疼热,饥而不欲食,食则吐蚘,下之,利不止。厥阴病是一个阴阳分裂的病,它跟少阴病是一个不同层面的问题。少阴病的很多问题是在于阳虚,而厥阴病它比较是在阴阳的分裂这件事情。那你把这个阴阳分裂的状况解决了之后呢,也可以算是你已经把厥阴病医好了。那通常还是可能有的。厥阴病它的一个特质哦,因为是它的这个寒气就这样往底下掉,热气就
方波先生
·
2024-01-23 18:38
机器学习 | 深入理解并掌握核心概念
我们将揭开机器学习背后的神秘面纱,解释监督学习、无监督学习、
强化学习
等不同类型的机器学习算法。目录初识人工智能机器学习概述机器学习算法分类模型评估深度学习概述Jupyt
亦世凡华、
·
2024-01-23 17:42
#
机器学习
机器学习
人工智能
深度学习
基础概念
经验分享
【
强化学习
日志】小鸟管道游戏的gym环境搭建和DDQN训练
最近在学习了
强化学习
之后,在guithub上下载了一些使用不同
强化学习
方法的小项目,收获颇丰,于是想自己搭建一个gym环境1,直接使用项目中的一些方法去训练,希望能够加深自己的一些理解游戏参考的github
wushenlunzhe
·
2024-01-23 16:32
python
人工智能
神经网络
机器学习
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他