E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
强化学习阅读笔记
深度
强化学习
算法PPO训练CartPole
PPO代码部分,训练离散动作1.导入必须要的包importtorchimporttorch.nnasnnimporttorch.nn.functionalasfimporttorch.optimasoptimfromtorch.distributionsimportCategoricalfromcollectionsimportdequeimportrandomimportmatplotlib.p
槑槑紫
·
2024-01-17 06:27
强化学习
算法
人工智能
python
pytorch
深度学习
一个可转移的连续
强化学习
的中心框架
TRANSFERVALUEORPOLICY?AAVALUE-CENTRICFRAMEWORKTOWARDSTRANSFERRABLECONTINUOUSREINFORCEMENTLEARNINGABSTRACTTransferringlearnedknowledgefromoneenvironmenttoanotherisanimportantsteptowardspracticalreinfor
Adam坤
·
2024-01-17 06:26
深度学习
机器学习
算法
深度强化学习
强化学习
论文研读
ICLR
强化学习
_PPO算法实现Pendulum-v1
目录PPO算法AC输出连续动作On-policy->Off-policyImportantsamplingIssueofImportanceSamplingAddConstraintPPO代码实现PPO算法PPO(ProximalPolicyOptimization)PPO是基于AC架构的,也就是说,PPO也有两个网络,分别是Actor和Critic,解决了连续动作空间的问题。AC输出连续动作我离
¥骁勇善战¥
·
2024-01-17 06:54
算法
强化学习
人工智能
论文笔记:信息融合的门控多模态单元(GMU)
整理了GMU(ICLR2017GATEDMULTIMODALUNITSFORINFORMATIONFUSION)论文的
阅读笔记
背景模型实验论文地址:GMU背景 多模态指的是同一个现实世界的概念可以用不同的视图或数据类型来描述
图学习的小张
·
2024-01-17 06:23
论文笔记
论文阅读
PPO 跑CartPole-v1
gym-0.26.2cartPole-v1参考动手学
强化学习
书中的代码,并做了一些修改代码importgymimporttorchimporttorch.nnasnnimporttorch.nn.functionalasFimportnumpyasnpimportmatplotlib.pyplotaspltfromtqdmimporttqdmclassPolicyNet
NoahBBQ
·
2024-01-17 06:52
RL
pytorch
gym
ppo
CartPole-v1
什么是ChatGPT,什么是大模型prompt
什么是ChatGptChatGPT是一个由美国的OpenAI公司开发的聊天机器人,它使用了大型语言模型,现在有GPT-3、GPT-3.5、GPT-4.0多个版本,目前还在快速发展,通过监督学习和
强化学习
进行了微调
张飞的猪大数据
·
2024-01-17 05:15
日常开发技术总结
chatgpt
prompt
人工智能
永远不要为你的收入设定上限。
子今
阅读笔记
day51永远不要为你的收入设定上限。“梦想有多大,舞台就有多大。”永远不要为你的收入是上限,这不是贪婪,而是去激发自己的潜能,让自己的价值最大化。
子今子安
·
2024-01-17 05:38
阅读笔记
:我看到了被手机带大的孩子
昨天学到“韵律运动”可以有效的调节压力,还有特别的一点是,动情的眼泪也会释放压力今天我们继续,这里一直讲的压力主要是脑压力这里我们先来澄清一个认知误区,我们脑子里面有两个“心”,一个是身体方面的心脏,一个是思考方面的大脑我们常混淆这一点,用心形物表达情感中的爱,用心痛表达自己的难过,拍着胸脯来保证一些事,而这些几乎全是大脑活动所以很多时候,遇到难题,我们用“打脑壳得狠”比用艰难,困难更接近真实那么
施吉涛
·
2024-01-17 04:58
【论文
阅读笔记
】Multi-modal brain tumor segmentation via disentangled representation learning and region-awa
ZhouT.Multi-modalbraintumorsegmentationviadisentangledrepresentationlearningandregion-awarecontrastivelearning[J].PatternRecognition,2024:110282.本文是杭州师范大学周同雪博士脑瘤分割系列最新论文(国家自然科学基金资助No.62206084),之前已经有多篇
cskywit
·
2024-01-17 01:21
医学图像分割
MRI分割
深度学习
论文阅读
笔记
【论文
阅读笔记
】Robust Multimodal Brain Tumor Segmentation via Feature Disentanglement and Gated Fusion
ChenC,DouQ,JinY,etal.Robustmultimodalbraintumorsegmentationviafeaturedisentanglementandgatedfusion[C]//MedicalImageComputingandComputerAssistedIntervention–MICCAI2019:22ndInternationalConference,Shenz
cskywit
·
2024-01-17 01:21
医学图像分割
MRI分割
多模态与缺失模态
论文阅读
笔记
【论文
阅读笔记
】MedTransformer: Accurate AD Diagnosis for 3D MRI Images through 2D Vision Transformers
arxiv,12Jan2024这篇文章思想较简单,用于诊断阿尔兹莫,这里概述一下。【核心思想】采用2D视觉Transformer分析3DMRI图像。它通过将3D图像切割成多个2D切片,并应用基于2DTransformer的模型,克服了3D模型在复杂性和效率方面的限制。该方法具有跨维度的共享编码器、特定维度的编码器以及注意力机制,以提高诊断的准确性和效率。这个模型在诊断阿尔茨海默病方面表现出强大的性
cskywit
·
2024-01-17 01:20
深度学习
医学图像分类
论文阅读
笔记
【论文
阅读笔记
】Prompt Tuning for Parameter-efficient Medical Image Segmentation
FischerM,BartlerA,YangB.Prompttuningforparameter-efficientmedicalimagesegmentation[J].MedicalImageAnalysis,2024,91:103024.【开源】【核心思想】本文的核心思想是提出了一种用于医学图像分割的参数高效的提示调整(PromptTuning)方法。这种方法基于预训练的神经网络,通过插入可
cskywit
·
2024-01-17 01:50
医学图像分割
prompts
论文阅读
笔记
prompt
超火的chartGPT到底是什么?没有账号我能使用吗
OpenAl的研究领域包括机器学习、自然语言处理和
强化学习
等。其中,GPT-3是OpenAl开发的一种大型语言模型,可以进行自然语言生成、翻译和问答等任务。什么是ChartGPT?
你别管我了
·
2024-01-17 00:16
ChatGPT
程序人生
职场和发展
开发语言
数据分析
python
深度学习机器臂控制_基于深度
强化学习
的机器人手臂控制
基于深度
强化学习
的机器人手臂控制杨淑珍;韩建宇;梁盼;古彭;杨发展;吕萍丽【期刊名称】《福建电脑》【年(卷),期】2019(035)001【摘要】基于深度
强化学习
策略,研究了机器人手臂控制问题.以两节机器人手臂为对象
觉主小VV
·
2024-01-16 22:54
深度学习机器臂控制
【
强化学习
与机器人控制论文 1】基于深度
强化学习
的机械臂避障
基于深度
强化学习
的机械臂避障1.引言2.论文解读2.1背景2.2将NAF算法用在机器人避障中3.总结1.引言本文介绍一篇2018年发表在EuropeanControlConference的文章,虽然不是顶会
ReEchooo
·
2024-01-16 22:24
强化学习与机器人控制论文解读
算法
人工智能
机器学习
【论文笔记】基于
强化学习
的连续型机械臂自适应跟踪控制
文章目录摘要关键词0引言1空间连续型机器人动力学模型1.1场景假设(1)环境假设(2)模型假设1.2公式分析2空间连续型机器人滑模控制器3基于
强化学习
的滑模控制器4仿真校验5结论摘要【针对问题】空间主动碎片清除操作中连续型三臂节机器人系统跟踪
Ctrl+Alt+L
·
2024-01-16 22:23
论文笔记
人工智能
机器学习
深度学习
机器人
强化学习
——Comparing Task Simplifications to Learn Closed-Loop Object Picking Using DRL(2019 RAL)
1简介任务是reach、grasp、lift,比较了rewardshaping、curriculumlearning、迁移学习,并迁移到了真实机器人场景中。本文抓取的方法框架是QT-Opt。2方法相机位置:机械臂腕部,眼在手上。state:深度图像、机械手张开宽度action:xyz平移、z轴旋转(想对于当前末端位姿)、机械手动作(开/闭)。每步平移最大1cm,初始state:随机选择n个物体放置
千羽QY
·
2024-01-16 22:53
机器人-强化学习
1024程序员节
强化学习
机器人
人工智能
基于
强化学习
的机器人路径寻优
二、使用差分进化算法辨识逆运动学的解三、基于
强化学习
的机械臂末端运动四、代码五、总结前言提示:这里可以添加本文要记录的大概内容:记录以前上课时学习的一些知识本文需要掌握的一些前置知识:1.机器人的D-H
kk的blog;
·
2024-01-16 22:53
机器人
机器人
基于
强化学习
的机器人抓取之 stochastic search
前言最近看google的机器人抓取算法QT-Opt,该方法通过stochasticsearch为每一个state选择action。沿着参考文献一路找到google的Learninghand-eyecoordinationforroboticgraspingwithdeeplearningandlarge-scaledatacollection,以及DeepReinforcementLearning
千羽QY
·
2024-01-16 22:53
机器人-强化学习
强化学习
随机优化
机器人
强化学习
——Sim-to-Real Robot Learning from Pixels with Progressive Nets (2017)
论文地址:https://arxiv.org/abs/1610.042861简介针对现实世界中DRL对复杂任务学习慢的问题,提出progressivenetworks来将仿真中学习的策略迁移到真实世界中。progressivenetworks是个通用框架,核心思想是将从低维视觉特征到高级policy之间的所有东西迁移到新任务,实现方式是将其他任务上预训练的特征通过侧面连接输入到新任务的网络中。实验
千羽QY
·
2024-01-16 22:53
机器人-强化学习
深度学习
计算机视觉
人工智能
(一)逐步搭建机器人(机械臂)
强化学习
环境 Pybullet + Gym + Stable Baselines3
(转载请注明出处)一、搭建基于pybullet的gym环境1.1基本文件结构My_Robot_Gym/setup.py__init__.py(forregister)my_robot_gym/assets/(forstoringrobotmodel,etc.)robot.urdfrl_envs/__init__.pymy_robot_gym.py(forgymenvcustomizationpyt
Bourne_Boom
·
2024-01-16 22:22
强化学习
机器人
强化学习
pybullet
深度强化学习
机器人学习环境
机器人
强化学习
-双机械臂
概要基于robosuite库,进行双臂机器人学习训练环境测试下面展示下分别控制两个机械手随机运动的画面:双臂显示场景如下:双臂调用代码如下:importnumpyasnpimportrobosuiteassuiteimportrobomimicimportrobomimic.utils.file_utilsasFileUtilsimportrobomimic.utils.torch_utilsas
琼筵醉月
·
2024-01-16 22:52
机器人
缓解大语言模型(LLM)幻觉的可行方法探究(课程综述)
缓解大语言模型(LLM)幻觉的可行方法探究转载请标明出处,抄袭摘要:2022年11月OpenAI推出能够进行多场景对话的大语言模型ChatGPT,ChatGPT凭借大规模的训练参数、海量的训练数据及
强化学习
人类反馈在语义理解
wavehaha
·
2024-01-16 21:30
LLM学习
语言模型
人工智能
自然语言处理
(2024,
强化学习
,提示扩展,原始提示中心引导)Parrot:用于文本到图像生成的帕累托最优多奖励
强化学习
框架
Parrot:Pareto-optimalMulti-RewardReinforcementLearningFrameworkforText-to-ImageGeneration公和众和号:EDPJ(进Q交流群:922230617或加VX:CV_EDPJ进V交流群)目录0.摘要3.基础4.方法4.1Parrot概述4.2按批次帕累托最优选择4.3原始提示中心引导5.实验0.摘要最近的研究表明,使用
EDPJ
·
2024-01-16 21:40
论文笔记
计算机视觉
人工智能
常见机器学习算法总结
基本算法总结正面.jpeg图的左半部分列出了常用的机器学习算法与它们之间的演化关系,分为有监督学习,无监督学习,
强化学习
3大类。
婉妃
·
2024-01-16 20:39
强化学习
AI构建实战 - 基于“黄金点”游戏(一)
简介
强化学习
(ReinforcementLearning)是机器学习的一种重要技术。本文首先简要介绍了
强化学习
的概念及思路,然后以Q-Learning算法为例介绍了如何进行训练。
人工智能MOS
·
2024-01-16 19:33
人工智能
游戏
机器学习
深度学习
强化学习
AI构建实战 - 基于“黄金点”游戏(二)
服务端接口为了让大家的AI可以顺利地进行游戏,并验证我们对策略和AI的一些实现,我们需要一些基础设施来帮助我们完成一些工作。这些工作包括游戏回合的控制、参与者之间的数据同步、游戏数据的储存等功能。为了简化这些基础工作,以便大家可以更好地集中于AI本身的设计和实现,我们搭建了一个服务器提供了一些基本的接口。使用这些接口,AI可以做到简单的调用RESTAPI接口实现游戏回合时间同步、获取历史数据、提交
人工智能MOS
·
2024-01-16 19:32
人工智能
游戏
服务器
深度学习
机器学习
【
阅读笔记
】Chain of LoRA
一、论文信息1论文标题ChainofLoRA:EfficientFine-tuningofLanguageModelsviaResidualLearning2发表刊物arXiv20233作者团队DepartmentofComputerScience,PrincetonUniversitySchoolofComputerScienceandEngineering,NanyangTechnologic
ZedKingCarry
·
2024-01-16 17:48
阅读笔记
大语言模型
高效微调
笔记
人工智能
算法
论文
阅读笔记
AI篇 —— Transformer模型理论+实战 (二)
论文
阅读笔记
AI篇——Transformer模型理论+实战(二)第二遍阅读(通读)2.1Background2.2ModelArchitecture2.2.1EncoderandDecoderStacks2.2.2ScaledDot-ProductAttention2.2.3Multi-HeadAttention2.3WhySelf-Attention2.4Training2.5Results2
键盘国治理专家
·
2024-01-16 17:17
Papers
ML&DL技术栈
论文阅读
笔记
人工智能
transformer
论文
阅读笔记
AI篇 —— Transformer模型理论+实战 (一)
资源地址Attentionisallyouneed.pdf(0积分)-CSDN第一遍阅读(Abstract+Introduction+Conclusion)Abstract中强调Transformer摒弃了循环和卷积网络结构,在English-to-German翻译任务中,BLEU得分为28.4,在English-to-French的翻译任务中的BLEU得分为41.0,用8张GPU训练了3.5天,
键盘国治理专家
·
2024-01-16 17:40
ML&DL技术栈
Papers
人工智能
论文阅读
笔记
*第六篇《基于多分支深度可分离卷积神经网络的滚动轴承故障诊断研究》论文
阅读笔记
[1]刘恒畅,姚德臣,杨建伟,张骄.基于多分支深度可分离卷积神经网络的滚动轴承故障诊断研究[J].振动与冲击,2021,40(10):95-102.基于多分支深度可分离卷积神经网络的滚动轴承故障诊断研究*note:本文研究方法不太能理解,后期需要再看一遍思路。一、文章本身文章框架思维脑图链接Researchquestion(s)(文章的研究问题是什么?—通常好的实证研究都有非常具体的研究问题,我们
子曰1884
·
2024-01-16 16:00
论文阅读
神经网络
深度学习
自动驾驶
Unsupervised Domain Adaptation by Backpropagation
阅读笔记
AboutthispaperTitle:UnsupervisedDomainAdaptationbyBackpropagationAuthors:YaroslavGanin,VictorLempitskyTopic:DomainAdaptationFrom:ICML2015Contributions本文的主要贡献是提出了一种全新的度量源域和目标域数据分布差异性的方法(基于对抗的方法)。Method
zhaoxin94
·
2024-01-16 16:44
强化学习
应用(二):基于Q-learning的无人机物流路径规划研究(提供Python代码)
一、Q-learning简介Q-learning是一种
强化学习
算法,用于解决基于马尔可夫决策过程(MDP)的问题。它通过学习一个价值函数来指导智能体在环境中做出决策,以最大化累积奖励。
IT猿手
·
2024-01-16 16:01
Qlearning
python
TSP
无人机
python
开发语言
深度强化学习
强化学习
TSP
强化学习
应用(一):基于Q-learning的无人机物流路径规划研究(提供Python代码)
一、Q-learning简介Q-learning是一种
强化学习
算法,用于解决基于马尔可夫决策过程(MDP)的问题。它通过学习一个价值函数来指导智能体在环境中做出决策,以最大化累积奖励。
IT猿手
·
2024-01-16 16:00
TSP
Qlearning
python
无人机
python
开发语言
深度强化学习
强化学习
Qlearning
阅读笔记
81
十.做特立独行且正确的事056绝大多数的痛苦都是幻觉,只是一时的感觉,而非永久不变的真相。这世界一直跟自己有这样那样的联系,而且是相当重要和清晰的联系,我们从光裸出生到最后离世,我们和世界的羁绊越多,生命就会越丰富多彩,生命的意义就会越大。057而正确本身其实也可能没有价值。若你是正确的,别人也正确,那正确并不稀奇;若你是错误的,别人也是错误的,那就是一帮乌合之众;若你是错误的,别人是正确,那你就
茹此说来
·
2024-01-16 15:29
《红楼梦》
阅读笔记
——王熙凤进宁国府
《红楼梦》
阅读笔记
——王熙凤进宁国府一、王熙凤的闺蜜周瑞家的送宫花到王熙凤住处,半刻工夫,平儿手里拿出两枝来,吩咐彩明送到那边府里给小蓉大奶奶戴去。王熙凤收到四朵宫花,分了两朵给秦可卿。
林欣依666
·
2024-01-16 14:32
2023-01-07
《刻意练习》【
阅读笔记
】心理表征将杰出人物和我们其他人区分开来的主要因素是:他们经过年复一年的练习,已经改变了大脑中的神经回路,以创建高度专业化的心理表征。
嘉禾老师
·
2024-01-16 11:33
机器学习学习笔记(吴恩达)(第三课第一周)(无监督算法,K-means、异常检测)
欢迎聚类算法:无监督学习:聚类、异常检测推荐算法:
强化学习
:聚类(Clustering)聚类算法:查看大量数据点并自动找到彼此相关或相似的数据点。
kgbkqLjm
·
2024-01-16 10:30
吴恩达机器学习2022
机器学习
算法
学习
强化学习
RL实战 01:RoboCup Rescue simulator
1.officialdocumentsofficialReadme:https://github.com/roborescue/rcrs-server/blob/master/README.adocjavacodes:GitHub-roborescue/adf-sample-agent-java:AsampleteamusingRCRSAgentDevelopmentFrameworkpython
天狼啸月1990
·
2024-01-16 09:46
#
强化学习RL
RL
RoboCup
强化学习
MATLAB Deep learning
regularizationandvalidationregularization正则化validation验证机器学习的类型有监督学习分类Classification回归Regression无监督学习聚类
强化学习
JNU freshman
·
2024-01-16 09:37
机器学习
人工智能
深度学习
matlab
深度学习
Pytorch函数——torch.gather详解
在学习
强化学习
时,顺便复习复习pytorch的基本内容,遇到了torch.gather()函数,参考图解PyTorch中的torch.gather函数-知乎(zhihu.com)进行解释。
beiketaoerge
·
2024-01-16 08:49
深度学习
pytorch
人工智能
python
多臂老虎机 “Multi-armed Bandits”
将
强化学习
与机器学习、深度学习区分开的最重要的特征为:它通过训练中信息来评估所采取的动作,而不是给出正确的动作进行指导,这极大地促进了寻找更优动作的需求。
EasonZzzzzzz
·
2024-01-16 07:48
强化学习
人工智能
自由
《财富自由之路》
阅读笔记
·3·究竟什么是“财富自由”?1、概念对概念进行清晰、准确、正确的定义很重要。语言学家说,如果我们对一件事情没有概念,我们的大脑就倾向于不去想这件事情。
Bingo冰果
·
2024-01-16 06:41
机器学习算法 - 马尔可夫链
马尔可夫链(MarkovChain)可以说是机器学习和人工智能的基石,在
强化学习
、自然语言处理、金融领域、天气预测、语音识别方面都有着极其广泛的应用>Thefutureisindependentofthepastgiventhepresent
想做后端的前端
·
2024-01-16 03:26
人工智能
人工智能
预训练技术在美团到店搜索广告中的应用
2、从零开始搭建创业公司后台技术栈3、2021年10月份热门报告免费下载4、微博推荐算法实践与机器学习平台演进5、腾讯PCG推荐系统应用实践6、
强化学习
算法在京东广告序列推荐场景的应用7、飞猪信息流内容推荐探索
智能推荐系统
·
2024-01-15 23:57
广告
大数据
算法
编程语言
推荐系统
多示例学习 (multi-instance learning, MIL) 学习路线 (归类、重点文章列举、持续更新)
文章目录0要点0要点说明:本文在于能够让大家能够更加快速地了解MIL这个领域,因此将从以下几个方面重点介绍MIL:MIL背景介绍;理论MIL概述:注意力网络;对比学习;介入学习;
强化学习
;GAN;应用MIL
因吉
·
2024-01-15 22:15
#
深度学习
#
机器学习
MIL
多示例
学习路线
当你遇到一个大问题而心情低落沮丧的时候,就指着自己说我很小,我很小!然后深呼吸对自己说,我可以处理,我比任何问题都大。
子今
阅读笔记
day40当你遇到一个大问题而心情低落沮丧的时候,就指着自己说我很小,我很小!然后深呼吸对自己说,我可以处理,我比任何问题都大。
子今子安
·
2024-01-15 20:30
强化学习
应用(七):基于Q-learning的物流配送路径规划研究(提供Python代码)
一、Q-learning算法简介Q-learning是一种
强化学习
算法,用于解决基于马尔可夫决策过程(MDP)的问题。它通过学习一个值函数来指导智能体在环境中做出决策,以最大化累积奖励。
优化算法MATLAB与Python
·
2024-01-15 19:14
Python
优化算法
python
开发语言
算法
人工智能
强化学习
强化学习
应用(六):基于Q-learning的物流配送路径规划研究(提供Python代码)
一、Q-learning算法简介Q-learning是一种
强化学习
算法,用于解决基于马尔可夫决策过程(MDP)的问题。它通过学习一个值函数来指导智能体在环境中做出决策,以最大化累积奖励。
优化算法MATLAB与Python
·
2024-01-15 19:44
Python
优化算法
python
开发语言
算法
人工智能
强化学习
强化学习
应用(五):基于Q-learning的物流配送路径规划研究(提供Python代码)
一、Q-learning算法简介Q-learning是一种
强化学习
算法,用于解决基于马尔可夫决策过程(MDP)的问题。它通过学习一个值函数来指导智能体在环境中做出决策,以最大化累积奖励。
优化算法MATLAB与Python
·
2024-01-15 19:13
Python
优化算法
python
开发语言
人工智能
强化学习
算法
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他