E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
累积梯度
快速了解Transformer与循环神经网络(LSTM/RNN)的区别
长序列处理:Transformer通过自注意力直接关联任意位置,避免
梯度
问题;RNN/LSTM在长序列中性能下降。
Panesle
·
2025-03-25 23:30
总结
rnn
transformer
lstm
人工智能
深度学习
WGAN对抗生成数据(matlab)代码
该模型引入了
梯度
惩罚(GradientPen
九亿AI算法优化工作室&
·
2025-03-25 13:46
matlab
开发语言
python
回归
算法
如何在多个GPU中训练非常大的模型?
一、并行训练策略1.数据并行原理:每个GPU保存完整的模型副本,处理不同的数据批次,通过同步
梯度
更新参数。在每个小批处理结束时,需要同步
梯度
或权重以免陈旧。
Mr终游
·
2025-03-25 07:00
大模型
人工智能
Momentum优化器的超参数调优方法
Momentum优化器是一种常用的优化算法,它通过引入动量的概念来加速
梯度
下降过程,特别是在处理高维数据和复杂模型时表现尤为出色。然而,Momentum优化器的性能高度依赖于其超参数的设置。
AI天才研究院
·
2025-03-25 03:34
计算
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Python 学习 第五册 深度学习 第1章 什么是深度学习
1.1.2机器学习1.1.3从数据中学习表示1.1.4深度学习之“深度”1.1.5用三张图理解深度学习的工作原理1.2深度学习之前:机器学习简史1.2.1概率建模1.2.2核方法1.2.3决策树、随机森林与
梯度
提升机
weixin_38135241
·
2025-03-24 18:25
python
学习
深度学习
人工智能
相同的问题看看Grok3怎么回答-详细讲讲PPO & GRPO原理
GRPO(基于
梯度
的相对策略优化)似乎是专为多代理系统设计的,优化代理之间的相对表现,目前信息有限,可能较少为人所知。
释迦呼呼
·
2025-03-24 17:46
AI一千问
人工智能
深度学习
机器学习
语言模型
算法
神经网络
计算机视觉
第三十九个问题-详细讲讲PPO & GRPO原理
PPO(ProximalPolicyOptimization)原理详解PPO(近端策略优化)是OpenAI于2017年提出的强化学习算法,旨在解决传统策略
梯度
方法中训练不稳定和样本效率低的问题。
释迦呼呼
·
2025-03-24 17:45
AI一千问
人工智能
深度学习
机器学习
语言模型
自然语言处理
算法
梯度
下降法理论理解
梯度
下降法:看似原始却透露着机器学习的本质前提:在研究
梯度
下降方法之前,你要理解矩阵运算(解析解)的方法矩阵运算目前的缺点只能进行对线性函数经行分析,无法对复杂的函数经行分析什么是
梯度
,以及
梯度
向量
梯度
下降的形象例子以及基本思想有三个兄弟被困在山上
伶星37
·
2025-03-24 14:57
机器学习
人工智能
高等数学,对
梯度
的理解
梯度
(Gradient)是多变量微分中非常重要的概念。它描述了一个多元函数在某一点的最大上升方向及其变化率,是向量微积分中的基本工具。
伶星37
·
2025-03-24 14:56
机器学习
深度学习框架PyTorch——从入门到精通(6.2)自动微分机制
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的
梯度
在本地设置禁用
梯度
计算设置requires_grad
梯度
模式(GradModes)默认模式(
梯度
模式)无
梯度
模式推理模式评估模式
Fansv587
·
2025-03-24 06:17
深度学习
pytorch
人工智能
经验分享
python
机器学习
Pytorch深度学习教程_9_nn模块构建神经网络
在前面的几篇中,我们已经介绍了Python、numpy及pytorch的基本使用,进行了
梯度
及神经网络的实践并学习了激活函数和激活函数,在上一个教程中我们学习了优化算法。
tRNA做科研
·
2025-03-24 06:08
深度学习保姆教程
深度学习
pytorch
神经网络
【笔记】扩散模型(五):Classifier-Free Guidance 理论推导与代码实现
论文链接:Classifier-FreeDiffusionGuidance上一篇文章我们学习了ClassifierGuidance,这种方法通过引入一个额外的分类器,使用
梯度
引导的方式成功地实现了条件生成
LittleNyima
·
2025-03-23 22:02
Diffusion
Models
笔记
机器学习
深度学习
抗积分饱和(Anti-Windup)常见的处理方法
抗积分饱和(Anti-Windup)是PID控制中防止积分项在输出受限时过度
累积
的关键技术。
鹿屿二向箔
·
2025-03-23 16:04
控制算法
AI模型技术演进与行业应用图谱
与此同时,模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%,联邦学习则通过加密
梯度
交换实现多机构数据协同训练。在应用层面,医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
智能计算研究中心
·
2025-03-23 15:26
其他
深度学习 Deep Learning 第8章 深度学习优化
本章首先介绍了优化在深度学习中的特殊性,然后详细讨论了多种优化算法,包括随机
梯度
下降(SGD)、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。
odoo中国
·
2025-03-23 10:26
AI编程
人工智能
深度学习
人工智能
优化
强化学习中策略网络模型设计与优化技巧
I.引言强化学习(ReinforcementLearning,RL)是一种通过与环境交互,学习如何采取行动以最大化
累积
奖励的机器学习方法。
数字扫地僧
·
2025-03-23 07:57
计算机视觉
深度学习
卷积神经网络Batch Normalization的作用
没有BN时,烤箱温度忽高忽低,导致有的层烤焦(
梯度
爆炸),有的层不熟(
梯度
消失)。
arron8899
·
2025-03-23 03:11
cnn
batch
人工智能
MSE分类时
梯度
消失的问题详解和交叉熵损失的
梯度
推导
下面是MSE不适合分类任务的解释,包含
梯度
推导。以及交叉熵的
梯度
推导。
阿正的梦工坊
·
2025-03-22 21:34
Machine
Learning
Deep
Learning
分类
人工智能
深度学习
机器学习
python 标准库之 functools 模块
其中,像partial可以创建一个新的可调用对象,这个对象固定了原函数的部分参数,有点像给函数穿上了“参数防护服”;reduce能对一个序列进行
累积
计算,就好比是一个勤劳的小会计,按顺序把序列里的数加起来或者做其他运算
36度道
·
2025-03-22 17:07
python系列学习笔记
python
直方图
梯度
提升:大数据时代的极速决策引擎
一、为什么需要直方图
梯度
提升?在Kaggle竞赛的冠军解决方案中,超过70%的获奖方案都使用了
梯度
提升算法。
万事可爱^
·
2025-03-22 14:14
大数据
机器学习
深度学习
直方图梯度提升
GBDT
算法
219.性能优化-内存优化-内存泄漏-本质原因:已经无用的对象未及时回收-非静态内部类
随着内存中这些无用对象的不断
累积
,应用会产生以下问题:内存占用逐渐上升,导致应用响应变慢;系统频繁触发垃圾回收(GC),造成卡顿现
我也念过晚霞
·
2025-03-22 14:43
性能优化
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混
minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混合精度优化/
梯度
累积
一个处女座的程序猿
·
2025-03-22 14:43
NLP/LLMs
CaseCode
transformer
minimind
预训练
大模型最新面试题系列:微调篇之微调基础知识
一、全参数微调(Full-Finetune)vs参数高效微调(PEFT)对比1.显存使用差异全参数微调:需存储所有参数的
梯度
(如GPT-3175B模型全量微调需约2.3TB显存)PEFT:以LoRA为例
人肉推土机
·
2025-03-22 05:42
大模型最新面试题集锦大全
面试
人工智能
AI编程
大模型微调
LLM
胡思又乱想(四)
本月已上班13天,迟到7次,
累积
时长71分钟。感觉我对自己有点过于宽容了。今天终于没有迟到。坐到工位第一件事,快速梳理今天的工作,我习惯拿笔写下来。
水军一号
·
2025-03-22 00:32
笔记
在网页跑3D多人互动之渲染效能瓶颈
累积
到目前测试回馈给我们的心得,主要问题还是在前端显示的部分。所以就来聊聊在网页跑3D多人互动之渲染效能瓶颈!!!数万个3D角色与场景物件需即时渲染,导致GPU/CPU过载,低端设备卡顿。
微网兔子
·
2025-03-21 17:24
後端技術
前端
网络
服务器
c++
unity
架构
3d
高性能计算:GPU加速与分布式训练
1.1.深度学习与计算挑战深度学习模型通常包含数百万甚至数十亿个参数,训练过程需要进行大量的矩阵运算和
梯度
更新,对计算资源的需求非常高。传统的CPU架构虽然具有较强的通用性,但其并行计
AI天才研究院
·
2025-03-21 06:17
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
技术债务的隐患:何时重构,何时妥协?
短期内看似能迅速交付,但随着时间推移,这些未优化的代码和架构缺陷会逐渐
累积
,成为制约团队敏捷性、影响系统稳定性和增加后期维护成本的隐患。
测试者家园
·
2025-03-20 08:23
测试开发和测试
质量效能
软技能
软件测试
质量效能
AI赋能
人工智能
项目管理
研发管理
技术债务
神经网络之参数初始化
合适的参数初始化方法有助于提高训练速度、避免
梯度
消失/爆炸问题,并且加速网络的收敛。一、参数初始化目的避免
梯度
消失和
梯度
爆炸:在深度神经网络中,参数初始化对
梯度
流动非常重要。
硬水果糖
·
2025-03-20 08:21
人工智能
神经网络
人工智能
深度学习
LoRA中黑塞矩阵、Fisher信息矩阵是什么
在机器学习中常用于自然
梯度
下降(NaturalGradientDescent
ZhangJiQun&MXP
·
2025-03-20 07:15
教学
2021
论文
2024大模型以及算力
矩阵
机器学习
人工智能
transformer
深度学习
算法
线性代数
NLP高频面试题(三)——普通RNN的
梯度
消失和
梯度
爆炸问题
普通RNN(循环神经网络)的
梯度
消失和
梯度
爆炸问题是指在训练深层或长序列的RNN模型时出现的两种典型问题:一、
梯度
消失(VanishingGradient)
梯度
消失是指在反向传播过程中,
梯度
逐层传播时变得越来越小
Chaos_Wang_
·
2025-03-19 23:34
NLP常见面试题
自然语言处理
rnn
人工智能
专门为高速连续扫描设计的TDI工业相机
其核心原理是通过多级积分和同步电荷转移技术,在物体连续运动时逐行扫描并
累积
信号,显著提升图像质量和信噪比(SNR)。它是一种特殊的线阵工业相机。
51camera
·
2025-03-19 21:49
工业相机
线阵工业相机
TDI工业相机
【机器学习】主成分分析法(PCA)
【机器学习】主成分分析法(PCA)一、摘要二、主成分分析的基本概念三、主成分分析的数学模型五、主成分分析法目标函数公式推导(`
梯度
上升法`求解目标函数)六、
梯度
上升法求解目标函数第一个主成分七、求解前n
若兰幽竹
·
2025-03-19 15:31
机器学习
机器学习
信息可视化
人工智能
纳米尺度仿真软件:Quantum Espresso_(18).纳米结构的几何优化
在每一步迭代中,软件会计算系统的
梯度
(即能量
kkchenjj
·
2025-03-19 07:54
分子动力学2
模拟仿真
分子动力学
仿真模拟
深度学习框架PyTorch——从入门到精通(5)自动微分
使用torch.autograd自动微分张量、函数和计算图计算
梯度
禁用
梯度
追踪关于计算图的更多信息张量
梯度
和雅可比乘积在训练神经网络时,最常用的算法是反向传播。
Fansv587
·
2025-03-19 06:20
深度学习
pytorch
人工智能
PyTorch 深度学习实战(12):Actor-Critic 算法与策略优化
本文将深入探讨Actor-Critic算法,这是一种结合了策略
梯度
(PolicyGradient)和值函数(ValueFunction)的强化学习方法。
进取星辰
·
2025-03-18 19:17
PyTorch
深度学习实战
深度学习
pytorch
算法
软件性能测试深度解析(进阶篇):JMeter高阶应用与性能工程体系构建
线程模型:基于Java线程池实现虚拟用户(VirtualUser)并发,通过Ramp-Up参数控制线程启动
梯度
。
追寻向上
·
2025-03-18 12:24
jmeter
功能测试
论文笔记:Deep Algorithm Unrolling for Blind Image Deblurring
主要贡献:DeepUnrollingforBlindImageDeblurring(DUBLID):提出一种可解释的神经网络结构叫做DUBLID,首先提出一种迭代算法,该算法被认为是
梯度
域中传统的广义全变分正则方法
爱学习的小菜鸡
·
2025-03-18 09:55
论文笔记
去模糊
图像处理
神经网络
技术解析麦萌短剧《阴阳无极》:从「性别偏见下的对抗训练」到「分布式江湖的架构重构」
1.初始模型偏差:继承权剥夺与
梯度
冻结陈千叶(Agent_C)的成长可视为有偏数据集上的训练:特征歧视:太极门继承规则(Legacy_Rule)作为传统分类器,强行将性别(Gender_Feature)
短剧萌
·
2025-03-18 08:15
分布式
架构
重构
SQL*LOADER错误总结
LOADER错误总结2015-12-0922:51by潇湘隐者,4900阅读,0评论,收藏,编辑在使用SQL*LOADER装载数据时,由于平面文件的多样化和数据格式问题总会遇到形形色色的一些小问题,下面是工作中
累积
春风剑客
·
2025-03-18 05:18
Oracle
21-
梯度
累积
原理与实现
在GPU内存不变的情况下,模型越来越大,那么这就意味着数据的batchsize智能缩小,这个时候,
梯度
累积
(GradientAccumulation)可以作为一种简单的解决方案来解决这个问题。
机器人图像处理
·
2025-03-17 19:34
深度学习算法与模型
人工智能
深度学习
YOLO
定积分及其在概率论与统计学中的应用
定积分及其在概率论与统计学中的应用1.背景介绍1.1定积分的概念定积分是微积分学中一个基本概念,它是对连续函数在一个区间上的
累积
变化量进行测度。
AI天才研究院
·
2025-03-17 17:47
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
基于发明的电容电感的新型热力
梯度
耦合电容电感lc谐振储能可行性
热
梯度
双层LC谐振储能结构可行性分析设计一种结合热力
梯度
、电容层(C层)、电感层(L层)及中间耦合层的双层LC谐振储能系统,需从物理原理、材料选择、热管理、能量耦合效率等方面进行综合评估。
热爱电气
·
2025-03-17 13:47
数学建模
java实现卷积神经网络CNN(附带源码)
什么是卷积神经网络(CNN)1.3卷积神经网络的应用场景相关知识与理论基础2.1神经网络与深度学习概述2.2卷积操作与卷积层原理2.3激活函数与池化层2.4全连接层与损失函数2.5前向传播、反向传播与
梯度
下降项目需求与分析
Katie。
·
2025-03-17 07:38
Java
实战项目
java
计算机视觉(Computer Vision, CV)的入门到实践的详细学习路线
微积分掌握
梯度
、
云梦优选
·
2025-03-16 18:57
计算机
数据库
大数据
计算机视觉
学习
人工智能
kaggle-ISIC 2024 - 使用 3D-TBP 检测皮肤癌-学习笔记
CatBoost在传统
梯度
提升决策树(GBDT)基础上,引入了一系列关键技术创新,以提升处理类
supernova121
·
2025-03-16 12:10
学习
笔记
基于热力
梯度
的线圈设计用来更替新型的储能方式
热力
梯度
储能技术通过调控温度场实现多模式能量转换,其潜力能量密度可达100Wh/kg以上。
热爱电气
·
2025-03-15 23:07
数学建模
物联网设备数据流转之搭建环境:开源高性能分布式支持SQL的时序数据库TDengine
背景我们的项目涉及物联网相关业务,由于一开始的年少无知,传感器数据采用了MySQL进行存储,经过近两年的数据
累积
,目前几个核心表,单表数据已过亿,虽然通过索引优化、SQL优化以及读写分离等措施,勉强满足基本的查询
Heartsuit
·
2025-03-15 21:27
时序数据库
物联网
分布式
TDengine
涛思数据
LLMs之Colossal-LLaMA-2:源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插
基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件)→数据预处理(初始化分词器+数据处理器+数据加载器)→模型训练(初始化模型/优化器/学习率调度器/
梯度
检查点
一个处女座的程序猿
·
2025-03-15 18:38
NLP/LLMs
精选(人工智能)-中级
Colossal-AI
LLaMA-2
大语言模型
自然语言处理
python opencv轮廓检测_python opencv中的不规则形状检测和测量
我的想法是使用形态
梯度
沿着冰晶获得良好的边缘并从那里开始工作;形态
梯度
似乎很有效.importnumpyasnpimportcv2img=cv2.imread('image.png')blur=cv2.
weixin_39584529
·
2025-03-15 18:04
python
opencv轮廓检测
机器学习中的
梯度
到底是什么?(chat-gpt问答)
1、
梯度
是对损失函数求导吗?是的,
梯度
是对损失函数(或目标函数)求导数值化后的结果。
梯度
告诉我们目标函数在某个点上的方向性和变化率,这些信息是优化算法推进参数评估和更新的重要指标。
湫怿
·
2025-03-15 16:19
机器学习
gpt
人工智能
梯度
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他