累积梯度

大模型微调技术的详细解析及对比

操作流程：加载预训练模型；用任务数据集（如分类文本）和优化目标（如最小化误差）训练；所有参数参与梯度更新。优势：模型充分学习任务特征，效果通常最

老兵发新帖·2025-07-23 14:15

过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶

1、过拟合、欠拟合及其解决方案过拟合、欠拟合机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了。也就是说欠拟合是模型表达能力不够，达不到很好的表达效果。而过拟合是在训练集的范围内表达能力过强，导致完全拟合了训练集。解决

Ryan_sz1·2025-07-23 13:49

深度强化学习 | 图文详细推导深度确定性策略梯度DDPG算法

目录0专栏介绍1演员-评论家架构1.1Critic网络优化1.2Actor网络优化2深度确定性策略梯度算法0专栏介绍本专栏以贝尔曼最优方程等数学原理为根基，结合PyTorch框架逐层拆解DRL的核心算法

Mr.Winter`·2025-07-23 09:08

初级复训第九次课收获

2、滚雪球效应维持小改变，累积成大改变。重复为大，剩者为王。不是有了希望才坚持，而是坚持了才有希望。引导着看到希望，人人都有颗玻璃心。3、SFBT的核心理念聚焦正向，解决，现在与未来，成功，一小步。

熙琄细语雪·2025-07-22 21:23

深度学习--利用梯度下降法进行多变量的二分类（感知机）

白话学生nit·2025-07-22 18:04

2025年想做黑客？推荐给你4本高质量黑客书籍，让你彻底研究黑客编程技术书！

写在开头在开始之前，我想说的是，学习并非如攀登险峻高峰，而是如滴水穿石般的持久累积。尤其当我们步入工作岗位之后，持之以恒的学习变得愈发不易，如同在茫茫大海中独自划舟，稍有松懈便可能被巨浪吞噬。

·2025-07-22 10:41

今日份的晚安

无戒学堂IP营打卡第150天，1317字，累积269945字。今日份的晚安语录同样摘自花瓣志，与之共勉！你不一定非得长成玫瑰，你乐意的话，做茉莉，做蔷薇，做无名小花，做千千万万。

北渔说·2025-07-22 02:56

飞算JavaAI：力臻开发之本真，破 AI 代码之繁琐，传统项目一键生成

2.1背景与实力2.2飞算JavaAI的“独门绝技”三、飞算JavaAI实战体验3.1IDEA插件安装配置3.2Main中写一个简单的梯度下降算法3.3main函数搭建一个卷积神经网络网络3.4飞算JavaAI

微学AI·2025-07-22 02:11

七月复盘&八月计划

一、七月复盘（一）整体写作情况1.日更31天，累积5万字2.写了5篇微小说，1篇影评，1篇剧评，24篇随笔3.看完了三本书，分别是《38度爱情》，《余温》，《孩子们的诗》4.听完了5节文学基础课（二）写作成绩情况

小妖精笑笑·2025-07-22 00:25

梯度下降家族：SGD/Adam优化器对比实验与选择策略

摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。

AI_DL_CODE·2025-07-21 19:56

智慧城管新突破：陌讯动态量化技术实现端侧模型压缩20倍

陌讯算法引入动态梯度调制机制，通过特征金字塔的跨层权重自适应调整，显著提升

2501_92487735·2025-07-21 15:59

《给孩子最好的礼物》P18~19

他用自己的辛勤劳作，为身患绝症的儿子累积了一道用生命筑起的防护墙。父亲二字，是多么的朴实，又是多么的伟大。作为家长，要当孩子的成长路上的指南针，舍得付出自己的时间与心思，才会收获一个健康又上进的孩子。

七乡杏坛·2025-07-21 14:23

深度学习模块实践手册（第十一期）

传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实

加油吧zkf·2025-07-21 07:03

应用层流量与缓存累积延迟解析

缓存累积延迟指多级缓存或消息队列机制中，各级延迟叠加导致数据更新滞后，例如数据库更新后，因消息队列、缓存刷新等环节延迟，用户最终看到的数据可能滞后数秒。

你一身傲骨怎能输·2025-07-20 19:27

每日一画/禅绕画练习day17

文/利子人生是由很多经验累积的，所以在跨出第一步时，要“敢”；只要敢于承担、敢接受、敢尝试、敢卖力，没有什么事情不能做。图片发自App我是左手咖啡右手诗篇的利子

Angel利子·2025-07-20 16:34

AI人工智能中Actor - Critic算法的深入解析与应用场景

AI人工智能中Actor-Critic算法的深入解析与应用场景关键词：Actor-Critic、强化学习、策略梯度、价值函数、深度强化学习、马尔可夫决策过程、A2C/A3C摘要：本文将深入解析Actor-Critic

AI智能探索者·2025-07-20 14:59

AI人工智能领域Actor - Critic算法的可视化分析

AI人工智能领域Actor-Critic算法的可视化分析关键词：Actor-Critic算法、强化学习、策略梯度、价值函数、可视化分析、神经网络、马尔可夫决策过程摘要：本文深入浅出地讲解Actor-Critic

AI智能探索者·2025-07-20 14:29

Actor - Critic：AI人工智能领域的新宠儿

Actor-Critic：AI人工智能领域的新宠儿关键词：强化学习、Actor-Critic、策略梯度、价值函数、深度强化学习、A2C、A3C摘要：Actor-Critic是强化学习领域的一种重要算法框架

·2025-07-20 13:52

《财务自由之路——七年内赚到你的第一个1000万》有感

读过这本书，我再次意识到，是我的观念和价值观阻碍我实现财富的累积。因为我会各种存不住钱，要不经过瑜珈推销人员忽悠，办了瑜珈卡；要不经健身房推销人员销售，办了健身卡；要不自己冲动消费，购买一堆衣服。

晓丽姐·2025-07-20 13:46

【机器学习&深度学习】什么是量化？

加速模型训练和推理2.4优化训练过程2.5降低部署成本小结：量化的应用场景三、量化的类型与实现3.1权重量化（WeightQuantization）3.2激活量化（ActivationQuantization）3.3梯度量化

一叶千舟·2025-07-20 11:34

在复杂的世界里，做一个简单的人

累积成难以承受的精神压力。要想成为不在意的人，需要不断的练习，接下来分享日本超人气禅师名取芳彦的著作别《想太多了》,通过对日常生活的烦恼

定能梦想成真·2025-07-20 10:03

嵌入式学习-PyTorch（8）-day24

torch.optim优化器torch.optim是PyTorch中用于优化神经网络参数的模块，里面实现了一系列常用的优化算法，比如SGD、Adam、RMSprop等，主要负责根据梯度更新模型的参数。️

LGGGGGQ·2025-07-20 09:21

【深度学习基础】PyTorch中model.eval()与with torch.no_grad()以及detach的区别与联系？

模型评估阶段(2)GAN训练中的判别器更新(3)提取中间特征5.关键区别总结6.常见问题与解决方案(1)问题：推理阶段显存爆掉(2)问题：Dropout/BatchNorm行为异常(3)问题：中间张量意外参与梯度计算

·2025-07-19 22:01

读你

云简简单单的漂移就积蓄了闪电的力量涵养了充沛的雨水一点一滴的凝聚从不停歇山静默无言担当了岁月也懂得坚守用承受来成就自己的厚重面向远方地平线开始的那一点点倔犟累积属于自己的巅峰溪蜿蜒曲折浅吟轻唱俯冲或跃起无论怎样的撞击只能更加汹涌澎湃不畏艰险去抵达是一种习惯云和云在一起才能叱咤风云山和山在一处才知山外有山水和水聚一起才懂上善若水岁月那么好不要太辜负会思考的人生才是有趣的会读书的人生才是善知的我看着你

旷山壹郎·2025-07-19 17:59

【日精进打卡第31天】

累积93遍《大学》3遍。累积93遍【经典名句分享】积善行，思利他【行～实践】一、修身：（对自己个人）1、学习永无止境。二、齐家：（对家庭和家人）1、整理内务。三、建功：（对工作）1、在家休息。

扬州方圆__周亮·2025-07-19 16:57

【机器学习笔记Ⅰ】9 特征缩放

(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如

巴伦是只猫·2025-07-12 05:30

目前主流图像分类模型的详细对比分析

以下是目前主流图像分类模型的详细对比分析，结合性能、架构特点及应用场景进行整理：一、主流模型架构分类与定量对比模型名称架构类型核心特点ImageNetTop-1准确率参数量（百万）计算效率典型应用场景ResNetCNN残差连接解决梯度消失

@comefly·2025-07-11 23:24

【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？

训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题

云博士的AI课堂·2025-07-11 23:22

动态时间规整（Dynamic Time Warping，DTW）补充案例

DTW的边界条件是确保累积距离矩阵计算“有起点、有规则”的基础，它规定了矩阵中第一行和第一列的累积距离如何计算（因为这两行/列是路径的“起点边缘”，没有“上一步”的全部选择）。

EmorZhong·2025-07-11 19:25

【亲测免费】 CatBoost 教程项目使用指南

教程项目使用指南tutorials项目地址:https://gitcode.com/gh_mirrors/tutorials1/tutorials1.项目介绍CatBoost是一个高效、灵活且易于使用的梯度提升库

·2025-07-11 11:33

Python 强化学习算法实用指南（二）

在本章中，我们将介绍一类新的算法——策略梯度方法，它们通过

·2025-07-11 11:59

使用Qlib基于LightGBM预测沪深300涨跌

本文配置一个基于LightGBM的梯度提升决策树（GBDT）模型，并使用金融数据集（包含158个技术指标特征）进行训练和预测。

DeepReinforce·2025-07-11 10:25

【机器学习&深度学习】为什么分类任务中类别比例应接近 1:1？

2.1⚠模型容易“偏科”2.2精确率、召回率失真2.3模型训练失衡，梯度方向偏移三、现实案例中的“灾难性后果”四、如何应对类别不平衡问题？

一叶千舟·2025-07-10 20:24

pytorch 自动微分

**梯度**2.计算梯度2.1标量梯度计算2.2向量梯度计算2.3多标量梯度计算2.4多向量梯度计算3.梯度上下文控制3.1控制梯度计算（withtorch.no_grad()）3.2累计梯度3.3梯度清零

this_show_time·2025-07-10 19:47

第八十九篇大数据开发中的数据算法：贪心策略 - 生活中的“精打细算”艺术

在资源有限的世界里，贪心算法教会我们：局部最优的累积，往往是通往全局最高效的捷径。本文通过3个生活化场景+原创图表，揭示大数据开发中最实用的优化策略。

·2025-07-10 19:46

为什么选择ER-GNSS/MINS-07？——低成本高精度的组合导航解决方案

惯性导航（INS）：自主性强，但误差随时间累积，几分钟后定位漂移。多源融合：组合导航的“智慧大脑”组合导航系统（GNSS/INS）通过多源传感器融合，结合卫星导航的长

·2025-07-10 17:01

【目标检测】Yolov7 的 ELAN 和 E-ELAN 模块演进（涉及到分组卷积，cardinality，梯度路径）

感觉从YOLOv6开始，YOLOv6系列感觉优化点都着重于推理速度上面，YOLOv6的RepBlock重参数化，给我的感觉就是算子融合进行加速。而YOLOv7，为了在各种架构的边缘设备上获得极致的推理速度。YOLOv7的工作：新的bagoffreebies（有效的训练技巧，不会增加推理的计算量）有规划的重参数化模型（不同边缘设备架构，不同的重参数化方法）新的动态标签分配方法为了更好的理解YOLOv

Jiangnan_Cai·2025-07-10 11:55

ResNet：深度卷积神经网络的里程碑

然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。

心想事“程”·2025-07-10 10:18

长期抖动（Long-Term Jitter）是啥？

长期抖动（Long-TermJitter）是衡量时钟信号在大量周期后累积的时间偏差的指标。

MCU的奇妙之旅·2025-07-10 05:45

NCCL 核心集体通信操作深度解析：从原理到优化实践

集体通信的价值二、NCCL核心操作深度解析2.1AllGather：全局数据聚合2.1.1定义与目标2.1.2算法原理2.1.3性能影响因素2.1.4测试方法（nccl-tests）2.2AllReduce：梯度聚合的核心

清风 001·2025-07-10 00:13

huggingface 笔记： Trainer

PyTorch模型设计的完整训练与评估循环只需将模型、预处理器、数据集和训练参数传入Trainer，其余交给它处理，即可快速开始训练自动处理以下训练流程：根据batch计算loss使用backward()计算梯度根据梯度更新权重重复上述流程直到达到指定的

UQI-LIUWJ·2025-07-09 21:23

【AI大模型】神经网络反向传播：核心原理与完整实现

一、反向传播的本质与意义反向传播（Backpropagation）是神经网络训练的核心算法，通过链式法则高效计算损失函数对网络参数的梯度，实现神经网络的优化学习。

我爱一条柴ya·2025-07-08 18:00

Python reduce()函数详解：累积计算的艺术

文章目录Pythonreduce()函数详解：累积计算的艺术一、reduce()函数基础1.核心概念2.工作原理3.基本语法二、reduce()的5种典型用法1.基本数值计算2.使用初始值3.复杂对象处理

盛夏绽放·2025-07-08 10:08

【机器学习笔记 Ⅱ】4 神经网络中的推理

与训练阶段不同，推理阶段不计算梯度也不更新权重，仅执行前向传播。以下是其实现原理和代码示例的完整解析：1.推理的核心步骤加载训练好的模型参数（权重和偏置）。前向传播：输入数据逐层计算，得到输出。

·2025-07-08 06:29

深度学习微调中的优化器全景解析：从理论到实践

文章目录一、基础优化器：深度学习微调的基石1.1随机梯度下降（SGD）1.2AdaGrad（自适应梯度算法）二、自适应优化器：现代深度学习的标配2.1RMSProp2.2Adam（自适应矩估计）三、大模型微调专用优化器

北辰alk·2025-07-08 04:13

VTK中使用梯度幅值计算边缘

#include#includevtkSmartPointerDetectEdgesWithGradient(vtkImageData*binaryVolume){</

点PY·2025-07-07 23:36

Python训练营打卡 Day50

resnet结构解析CBAM放置位置的思考针对预训练模型的训练策略差异化学习率三阶段微调预训练模型+CBAM模块知识点回顾ResNet结构解析残差块：ResNet的核心是残差块，它通过残差连接解决了深层网络的梯度消失问题

·2025-07-07 22:58

北上广深编程语言生态与薪资全景分析（2024-2025）

目录前言一、用户数量与地域分布1.1开发者基数与城市能级1.2编程语言流行度对比二、薪资水平与行业关联2.1城市薪资梯度2.2语言薪资排名2.3行业薪资溢价三、技术趋势与影响因素3.1行业需求驱动3.2

小李也疯狂·2025-07-07 12:22

【PyTorch】教程：torch.nn.GELU

tanh，默认为none;定义高斯误差线性单元函数GELU(x)=x∗ϕ(x)\text{GELU}(x)=x*\phi(x)GELU(x)=x∗ϕ(x)其中ϕ(x)\phi(x)ϕ(x)为高斯分布的累积分布

老周有AI~算法定制·2025-07-07 11:13

python实现多元线性回归算法 (附完整源码)

python实现多元线性回归算法1.使用正规方程实现多元线性回归代码说明运行结果示例2.使用梯度下降法实现多元线性回归代码说明运行结果示例进一步优化与注意事项下面是使用Python从头实现多元线性回归算法的完整源码

源代码大师·2025-07-07 03:20

推荐频道