E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
梯度归一化
从LayerNorm到RMSNorm:深度学习
归一化
技术的进化!qwen2.5的技术。
RMSNorm(RootMeanSquareNormalization,均方根
归一化
)是一种用于深度学习的
归一化
技术,是LayerNorm(层
归一化
)的一种改进。
KangkangLoveNLP
·
2025-03-14 13:29
qwen2.5
深度学习
人工智能
transformer
pytorch
自然语言处理
python
神经网络
十种处理权重矩阵的方法及数学公式
1.权重
归一化
(WeightNormalization)目的:通过分离权重向量的范数和方向来加速训练。
阳光明媚大男孩
·
2025-03-14 13:26
矩阵
机器学习
线性代数
XGBoost算法深度解析:从原理到实践
一、算法起源与核心思想XGBoost(eXtremeGradientBoosting)由陈天奇于2014年提出,是
梯度
提升决策树(GBDT)的优化版本。
彩旗工作室
·
2025-03-14 11:36
人工智能
算法
机器学习
人工智能
深度学习之优化器Optimizer介绍
优化器(Optimizer)是深度学习训练中非常关键的组件,它负责根据损失函数的
梯度
来更新模型参数,从而使模型性能不断提升。1.优化器的作用和重要性优化器是训练深度学习模型的核心组件之一。
yueguang8
·
2025-03-14 08:19
人工智能
深度学习
人工智能
深度学习 常见优化器
一、基础优化器随机
梯度
下降(SGD)•核心:∇θJ(θ)=η*∇θJ(θ)•特点:学习率固定,收敛路径震荡大•适用场景:简单凸优化问题•改进方向:动量加速二、动量系优化器2.SGDwithMomentum
Humingway
·
2025-03-14 07:13
深度学习
人工智能
深度学习中常用的优化器
梯度
下降是优化神经网络的首选方法。
无能者狂怒
·
2025-03-14 04:16
深度学习
计算机视觉
人工智能
深度学习
算法
PyTorch深度学习框架60天进阶学习计划 - 第19天:时间序列预测
PyTorch深度学习框架60天进阶学习计划-第19天:时间序列预测目录时间序列预测概述滑动窗口数据构造方法
归一化
策略对比:MinMaxvsZ-ScoreLSTM基础原理Attention机制与LSTM
凡人的AI工具箱
·
2025-03-13 22:11
深度学习
pytorch
学习
人工智能
AI编程
迁移学习
python
模型训练和推理
训练时需要
梯度
,推理时不需要怎么理解“
梯度
”?
一杯水果茶!
·
2025-03-13 12:02
视觉与网络
python
梯度
反向传播
训练
推理
【
梯度
下降算法】
梯度
下降算法:第一章
梯度
下降的历史沿革1.1优化方法的演进脉络从17世纪牛顿时代的数值解法,到20世纪最优控制理论的发展,直至现代机器学习对优化算法的特殊需求,
梯度
下降算法在数学优化史上占据重要地位。
蝉叫醒了夏天
·
2025-03-13 12:01
机器学习
算法
分布式并行策略概述
每个副本完成自己批次的前向和反向传播计算后,
梯度
被汇总并同步更新到所有模型副本。优势:易于实现和扩展。可以显著减少训练时间,尤其是当模型较小,而数据集较大时。
灵海之森
·
2025-03-13 10:11
LLM
算法
分布式
C++ 平面拟合原理和最小法实现示例
Ax+By+Cz+D=0][Ax+By+Cz+D=0][Ax+By+Cz+D=0]其中:法向量:(n=(A,B,C))(\mathbf{n}=(A,B,C))(n=(A,B,C)),表示平面的朝向(通常
归一化
为单位向量
点云SLAM
·
2025-03-12 18:16
算法
数学
c++
平面
线性代数
平面拟合
最小二乘法
PCA算法
梯度
提升决策树(GBDT)
GBDT(GradientBoostingDecisionTree),全名叫
梯度
提升决策树,是一种迭代的决策树算法,又叫MART(MultipleAdditiveRegressionTree),它通过构造一组弱的学习器
binggorun
·
2025-03-12 09:18
决策树
算法
机器学习
【每日论文】Forgetting Transformer: Softmax Attention with a Forget Gate
虽然Transformer没有显式的循环形式,但我们展示了一种通过以数据依赖的方式降低未
归一化
注意力分数的自然方法,将遗忘门融入Transformer。我们称这种注意力机制为“遗忘注意力”,并
WHATEVER_LEO
·
2025-03-12 08:12
每日论文
transformer
深度学习
人工智能
自然语言处理
计算机视觉
语言模型
深度学习训练中GPU内存管理
文章目录概述常见问题1、设备选择和数据迁移2、显存监控函数3、显存释放函数4、自适应batchsize调节5、
梯度
累积概述在深度学习模型训练中,主流GPU显存通常为8GB~80GB,内存不足会导致训练中断或
@Mr_LiuYang
·
2025-03-11 19:24
遇到过的问题
内存管理
内存溢出
out
of
memory
GPU内存
目标检测
3.GroundTruth格式:包含类别和边界框坐标,常见的有YOLO(
归一化
中心点坐标和宽高)、VOC(左上角和右下角坐标)、COCO(左上角坐标和
煤烦恼
·
2025-03-11 15:22
目标检测
人工智能
大数据
pytorch
《Natural Actor-Critic》译读笔记
Theactor的更新通过使用Amari的自然
梯度
方法进行策略
梯度
的随机估计来实现,而评论家则通过线性回归同时获得自然策略
梯度
和价值函数的附加参数。
songyuc
·
2025-03-11 11:21
笔记
基于PyTorch的深度学习——机器学习3
如果搭建的神经网络层数不多,选择sigmoid、tanh、relu、softmax都可以;而如果搭建的网络层次较多,那就需要小心,选择不当就可导致
梯度
消失问题。
Wis4e
·
2025-03-11 07:47
深度学习
机器学习
pytorch
神经网络中
梯度
计算求和公式求导问题
以下是公式一推导出公式二的过程。表达式一∂E∂wjk=−2(tk−ok)⋅sigmoid(∑jwjk⋅oj)⋅(1−sigmoid(∑jwjk⋅oj))⋅∂∂wjk(∑jwjk⋅oj)\frac{\partialE}{\partialw_{jk}}=-2(t_k-o_k)\cdot\text{sigmoid}\left(\sum_jw_{jk}\cdoto_j\right)\cdot(1-\tex
serve the people
·
2025-03-11 06:09
日常琐问
神经网络
机器学习
算法
XGBClassifiler函数介绍
XGBoost是一种高效且灵活的
梯度
提升决策树(GBDT)实现,它在多种机器学习竞赛中表现出色,尤其擅长处理表格数据。
浊酒南街
·
2025-03-11 05:32
#
算法
机器学习
XGB
【深度学习】Adam(Adaptive Moment Estimation)优化算法
通过动态调整每个参数的学习率,在非平稳目标(如深度神经网络的损失函数)中表现优异目录基本原理和公式笼统说明:为什么Adam算法可以帮助模型找到更好的参数基本概念动量(Momentum):跟踪
梯度
的指数衰减平均
辰尘_星启
·
2025-03-10 20:51
机器学习--深度学习
深度学习
算法
人工智能
Adam
pytorch
python
深度学习笔记——Resnet和迁移学习
然而,随着网络深度的增加,一些问题也随之出现,最突出的是
梯度
消失/爆炸问题。这使得深层网络难以训练。
梯度
消失:
梯度
消失是指在训练深度神经网络时,通过多层传递的
梯度
(误差)变得非常小,接近于零。
肆——
·
2025-03-10 15:17
深度学习
深度学习
笔记
迁移学习
基于PyTorch的深度学习4——使用numpy实现机器学习vs使用Tensor及Antograd实现机器学习
最后,采用
梯度
梯度
下降法,通过多次迭代,学习到w、b的值。以下为具体步骤:1)导入需要的库。
Wis4e
·
2025-03-10 09:09
深度学习
机器学习
pytorch
Pytorch 第九回:卷积神经网络——ResNet模型
该模型是基于解决因网络加深而出现的
梯度
消失和网络退化而进行设计的。接下来给大家分享具体思路。
Start_Present
·
2025-03-10 09:05
pytorch
cnn
python
分类
深度学习
每日AIGC最新进展(41):上海AI Lab提出新型DiT结构Lumina-Next、Adobe研究院提出图像与文本对齐方法AlignIT、新型多模态图像生成模型MUMU
该模型通过3DRoPE和三明治
归一化
等技术,提高了图像和视频生成的稳
沉迷单车的追风少年
·
2025-03-10 01:06
Diffusion
Models与深度学习
AIGC
人工智能
深度学习
扩散模型
计算机视觉
adobe
PyTorch 学习路线
机器学习基础:理解神经网络、损失函数、优化器(如
梯度
下降)等概念。学习资源Python入门:Python官方教程机器学习基础
gorgor在码农
·
2025-03-09 22:07
#
python入门基础
python
pytorch
PyTorch:Python深度学习框架使用详解
自动微分:自动计算
梯度
,简化了机器学习模型的训练过程。丰富的API:提供了丰富的神经网络层、函数和损失函数。跨平
零 度°
·
2025-03-09 21:25
python
python
深度学习
pytorch
搜广推校招面经三十八
二、Transformer中对
梯度
消失或者
梯度
爆炸的处理在Transformer模型中,
梯度
消失和
梯度
爆炸是深度学习中常见的问题,尤其是在处理长序列数据时。
Y1nhl
·
2025-03-09 12:45
搜广推面经
算法
pytorch
推荐算法
搜索算法
机器学习
OpenCV计算摄影学(16)调整图像光照效果函数illuminationChange()
操作系统:ubuntu22.04OpenCV版本:OpenCV4.9IDE:VisualStudioCode编程语言:C++11算法描述对选定区域内的
梯度
场应用适当的非线性变换,然后通过泊松求解器重新积分
村北头的码农
·
2025-03-09 09:23
OpenCV
opencv
人工智能
计算机视觉
tensorflow keras 报错 :No gradients provided for any variable 原因与解决办法
错误分析Nogradientsprovidedforanyvariable这个意思是没有
梯度
给已知的所有函数,为什么会出现这个错误呢,因为在深度学习中,
梯度
的更新是由于反向传播算法的实现的,如果损失函数没有与已知的任何
研志必有功
·
2025-03-09 06:26
tensorflow报错
tensorflow
深度学习
机器学习
神经网络
自然语言处理
图像处理篇---opencv中的图像特征
优点5.缺点二、形状特征:Hu矩1.Hu矩简介2.Hu矩计算步骤3.OpenCV实现4.优点5.缺点三、其他可用于传统机器学习的特征1.颜色特征颜色直方图颜色矩2.边缘特征Canny边缘检测HOG(方向
梯度
直方图
Ronin-Lotus
·
2025-03-08 19:35
图像处理篇
深度学习篇
图像处理
opencv
人工智能
python
3.6手写数字识别项目
-通过`transforms.Compose`对数据进行预处理,包括转换为张量和
归一化
。-使用`DataLoader`创建训练和测试数据集的生成器。
不要不开心了
·
2025-03-08 11:33
pytorch
神经网络
人工智能
机器学习
深度学习
python前闭后开_opencv 形态学变换(开运算,闭运算,
梯度
运算)
形态学里把腐蚀和膨胀单独拿了出来,其他操作(保括膨胀和腐蚀的组合操作)都叫形态学变换。opencv里有包:cv2.morphologyEx()morphology:译文形态学使用python+opencv讲解开运算开运算:对图像先进行腐蚀,然后对腐蚀后的图进行膨胀morphologyEx运算结果=cv2.morphologyEx(源图像img,cv2.MORPH_OPEN,卷积核k)cv2.MOR
weixin_39814126
·
2025-03-08 05:09
python前闭后开
特征缩放:统一量纲,提高模型性能
这种量纲不统一会给许多机器学习算法(如
梯度
下降)带来问题,导致收敛速度慢、模型性能差等。特征缩放(FeatureScaling)就是一种用于解决这个问题的常用数据预处理
AI天才研究院
·
2025-03-08 03:04
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
01计算机视觉学习计划
基础夯实✅目标:掌握数学基础、Python/C++编程、基本图像处理1️⃣数学基础(2周)每日2小时线性代数:矩阵运算、特征值分解(推荐《线性代数及其应用》)概率统计:高斯分布、贝叶斯定理微积分:偏导数、
梯度
下降傅里叶变换
依旧阳光的老码农
·
2025-03-07 20:15
计算机视觉
计算机视觉
人工智能
第37篇Personalized Federated Learning: A Meta-Learning Approach(perfedavg联邦学习+元学习)2020个性化联邦学习使用Hessian
通过寻找一个初始共享模型,让用户基于自身数据执行少量
梯度
下降步骤就能快速适应
还不秃顶的计科生
·
2025-03-07 17:44
联邦学习
学习
2021年7月初,深圳TPlink图像算法工程师面试题分享
问题一:Batch-norm作用和参数batchnorm的作用batchnorm对于输入数据做了零均值化和方差
归一化
过程,方便了下一层网络的训练过程,从而加速了网络的学习。
niuyunpang
·
2025-03-07 11:16
算法
链表
机器学习
深度学习
人工智能
深度学习_第二轮
在计算损失函数的
梯度
(即关于权重的偏导数)时,需要考虑整个数据集中的所有样本。对于每个样本((x_i),(y_i)),我们计算其对损失函数的贡献,并通过求和或平均这些贡献
Humingway
·
2025-03-06 22:16
深度学习
深度学习
人工智能
对深度学习中的基本概念—
梯度
的理解
本文讨论一下对“
梯度
”的理解。“
梯度
”是深度学习中基本又非常核心的概念,没有它就没有人工智能的今天。
Humingway
·
2025-03-06 22:15
深度学习
深度学习
人工智能
YoLo运用学习7
目录前言一、C#环境使用YoLo模型进行AI推理检测1.加载图片2.图片预处理3.加载onnx模型并推理4.数据后处理5.图片属性值缩放还原和反
归一化
6.将解析到的信息的集合绘制成处理后图片总结前言根据
老农民编程
·
2025-03-06 19:51
YoLo学习
YOLO
学习
遗传算法基础讲解
无需
梯度
信息:对目标函数的数学性质要求低,适合黑箱优化。全局搜索能力:通过种群并行搜索,避免陷入局部最优,适合多维优化。
HH予
·
2025-03-06 18:42
深度学习
图像识别技术与应用课后总结(14)
常用的优化算法如
梯度
一元钱面包
·
2025-03-06 12:15
人工智能
8.1 从28GB到7GB!大模型显存暴降4倍的量化实战指南
以LLaMA-7B模型为例,其参数规模为70亿(7B),若使用FP32(32位浮点数)存储,单参数占用4字节,总显存需求为:7B×4Bytes=28GB实际场景中,模型训练还需额外存储
梯度
(Gradients
少林码僧
·
2025-03-06 11:42
掌握先机!从
0
起步实战
AI
大模型微调
打造核心竞争力
语言模型
人工智能
gpt
基于 GEE 计算年均
归一化
植被指数 NDVI、植被覆盖度 FVC
目录1完整代码2运行结果1完整代码//导入研究小区的集合Map.centerObject(roi);Map.addLayer(roi,{'color':'grey'},'roi');//应用缩放因子functionapplyScaleFactors(image){varopticalBands=image.select('SR_B.').multiply(0.0000275).add(-0.2);
@HNUSTer
·
2025-03-06 04:41
Google
Earth
Engine(GEE)
GEE
云计算
云平台
遥感大数据
数据集
INA(In-Network Aggregation)技术
核心原理在传统分布式训练中,计算节点(如GPU)需要将本地计算的
梯度
或中间结果发送到中心节点(如参数服务器)进行聚合,这会产生大量的网络传输。In-NetworkAggregation则是通过可编
一只积极向上的小咸鱼
·
2025-03-06 01:22
人工智能
智能优化算法应用:基于旗鱼算法与双伽马校正的图像自适应增强算法
1.全局双伽马校正设图像的灰度值范围被
归一化
到[0,1]范围之内,基于全局亮度的双伽马调整
智能算法研学社(Jack旭)
·
2025-03-05 20:11
智能优化算法应用
图像增强
算法
计算机视觉
人工智能
大模型训练内存预估计算方法
671B参数总显存≈6710亿×2字节≈1,342GB实际训练时需额外存储
梯度
、优化器
junjunzai123
·
2025-03-05 13:29
人工智能
深度学习
机器学习
Python | Pytorch | Tensor知识点总结
如是我闻:Tensor是我们接触Pytorch了解到的第一个概念,这里是一个关于PyTorchTensor主题的知识点总结,涵盖了Tensor的基本概念、创建方式、运算操作、
梯度
计算和GPU加速等内容。
漂亮_大男孩
·
2025-03-05 08:27
Python拾遗
python
pytorch
深度学习
人工智能
手写BatchNorm与LayerNorm:从原理到实现
手写BatchNorm与LayerNorm:从原理到实现大家好,今天我们将手写实现BatchNormalization(BatchNorm,批
归一化
)和LayerNormalization(LayerNorm
_Itachi__
·
2025-03-04 15:11
自动驾驶
人工智能
计算机视觉
python
规控算法工程师的技术图谱和学习路径
微积分:
梯度
下降、泰勒展开、动态系统建模(支持控制算法推导)。概率论与统计学:贝叶斯理论、马尔可
执于代码
·
2025-03-03 23:09
开发者职业加速服务
算法
学习
图像算法工程师的技术图谱和学习路径
1.基础数学与编程数学基础:线性代数:矩阵运算、特征值、特征向量、奇异值分解(SVD)等概率论与统计:概率分布、贝叶斯定理、最大似然估计(MLE)、假设检验等微积分:导数、
梯度
、最优化方法(
梯度
下降、
执于代码
·
2025-03-03 23:09
开发者职业加速服务
算法
学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他