AITIME论道

干货！面向低精度量化的神经网络训练算法

点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入！

对神经网络进行低精度量化，尤其是混合精度量化，是提升神经网络部署效率的重要方法之一。然而，如何让神经网络适应低精度的表示，如何选取最合适的量化精度，依然存在很多没有解决的问题。

本报告将从两方面探讨低精度神经网络的训练方法。为了获得最优的量化精度，我们提出了BSQ比特稀疏量化算法，使模型能在训练过程中自发得到合适的混合精度。

为了使模型更适应量化带来的性能影响，我们进一步提出了用权值鲁棒性描述模型泛化能力和低精度表现的理论模型，并依据此模型提出HERO训练算法以提升模型的权值鲁棒性，进而获得泛化能力强且对低精度量化鲁棒的模型。两种方法为获得更高效且性能更好得神经网络模型提供了可能性。

本期AI TIME PhD直播间，我们邀请到杜克大学电子与计算机工程系博士——杨幻睿，为我们带来报告分享《面向低精度量化的神经网络训练算法》。

杨幻睿：

本科毕业于清华大学电子工程系，博士毕业于杜克大学电子与计算机工程系，师从李海和陈怡然老师。博士毕业后，杨幻睿将加入加州大学伯克利分校从事博士后研究。杨幻睿的主要研究方向为提升深度学习模型的运行效率和鲁棒性。

今天要介绍的研究主要是关于高效深度学习的问题。我们发现随着深度学习的发展，学者们提出了越来越多神经网络的模型。在追求更高的模型性能的过程中，新提出的神经网络架构所占用的参数量需要的计算量都在逐渐提高。

Challenges of DNN from Efficiency Perspective

上图所示的还是一些相对较早的模型，我们现在用的transformer、Bert模型在取得更好性能的同时，都使用了更高的参数量与计算量。

尽管深度学习模型如今发展迅速，但如果我们想把模型用在实际场景之中，就要考虑在很多硬件设备上的计算能力是受限的。为了能够更好的将深度学习模型部署到现实世界当中，我们必须对这些高性能的模型进行压缩和加速。

Efficiency Improvement for DNN Models

• Pruning

• Set weight element to zero

• Save storage and computation (structural pruning)

• Low-rank factorization

• Decompose layer into low-rank matrix multiplications

• Keep input/output dimensions, suitable for complex architecture

• Quantization

• Represent weights/activations in fixed-point representation

• Reduce memory size, friendly to hardware deployment

目前主流的针对人工设计的模型的压缩加速方式大致分为3种。第一种是剪枝，既将一些权重设为0使其可以通过编码的方式减少一定程度的存储量。跟进一步可以通过结构化剪枝的方式直接减小模型参数的维度，实现计算量的减少。

第二种方法是对模型做低秩的分解，即把一个卷积层分解成两个或多个低秩的矩阵相乘。这样我们就可以在保留原始模型输入输出维度的基础上进一步缩小模型的计算量。

第三种方法是做模型的量化，把模型的权重用一种定点的低精度编码来表示。这样也在一定程度上更适应小型硬件，比如移动端或嵌入式处理器上的存储与运算。

Goal of My Research

对于压缩人工设计模型，我们的工作主要集中于使用一些正则项来诱导模型的压缩。我们选择使用可导的神经网络正则项是因为其能和神经网络的训练很好结合。

在神经网络训练中我们使用梯度下降算法，通过优化器来优化可导的损失函数L。而如果我们有可导的正则化项，我们就能将其加在损失函数上使其可以正常的用优化器训练。

更进一步，我们可以通过控制 α 的大小来选择压缩的程度，实现对模型大小与性能之间的均衡。因此，我们研究的重点在于如何找到一个合适的正则项来诱使模型在训练中逐渐变得稀疏、低秩以及适应低精度表示。

在本次报告中我们重点来讨论如何通过正则项得到低精度的模型。

The Need of Fixed-point Quantization

我们为何需要低精度呢？低精度主要带来了两个好处。一个最直接的好处是可以减少模型的存储消耗。另一方面对于硬件部署来讲，低精度表示，尤其是定点低精度的表示大幅度的减少了计算所需要的能量和面积开销。如下图所示：

可见，低精度定点计算可以带来很大的优势。

Challenge of Quantization

对于低精度量化而言，和之前剪枝等方法相似的一点是，模型有些层是重要的，有些层没那么重要。我们希望给更重要的层赋予更高的精度，不重要的层赋予较低的精度，这也由此引入了混合精度量化的概念。

目前的问题是，如何找到一个量化的分布方式使得我们模型可以得到一个最优的、效率与性能之间的trade off。

量化与剪枝、分解主要的区别在于模型的精度并不能用一个模型权重值的可导函数来表示。在描述模型稀疏性时，我们可以用所有权重绝对值的和，也就是L1范数，或者叫LASSO，来作为稀疏性的度量。

我们之前的也就也提出了DeepHoyer之类的稀疏正则项。然而，对量化而言找到这样的正则项是困难的。模型的精度也并不是模型的权重值的一个函数，我们很难去直接设计一个可导的正则项。为了规避这一问题，前人的研究通过一些判据分析哪些层是重要的，然后根据重要性人工指定一个精度的分布。这样很难保证获得最好的效果。

此外也有人尝试通过神经网络结构搜索（NAS）的方式直接搜出最优的精度组合，但这样需要很大的运算量。

对于我们而言，既然我们希望可以通过一个可导的正则项来实现量化，而我们又对稀疏正则项比较熟悉，那么能否把量化的问题也转变成一个稀疏型的问题呢？另外鉴于量化精度不是权重值的函数，我们现在的思路就是不看权重值本身，而是看其在量化之后的比特表示。

A Bit-level View of Quantization

我们的目标是通过正则项诱导比特数的减少，那么我们什么时候可以减少表示的比特数呢？下面我们来从比特的层面观察一下：对于一个矩阵

• 所有元素的最高比特（MSB）为0:精度可直接降低

• 所有元素的最低比特（LSB）为0:精度可以通过右移降低，得到结果乘2即为原数值。

通过这一观察，我们发现比特层面的结构化稀疏可以带来精度的减少。因此我们提出了BSQ的训练方法——通过引入结构化的比特级稀疏性，可以诱导出混合精度量化的模型。

BSQ Training Pipeline

• 比特层面的神经网络表示

在这里我们提出比特层面神经网络的训练算法。在训练过程中，我们从8bit的量级开始，这样不太会影响模型的性能。在这里我们直接使用模型权重的每一位比特值作为可训练参数。为了实现梯度累计在训练过程中我们允许每一位比特值用浮点数表示。在正向传播时我们对比特值进行量化来模拟量化后网络的表现，反向传播的时候我们直接把权值的梯度传过了rounding function，并传到了每一位的bit表示上。

为了实现稀疏性，我们提出了以下方法：利用group LASSO使得某一层参数中所有权重的某一比特同时变为零。

• Bit-level group LASSO

在整体的训练算法上，我们采用了如下的一个训练目标：

我们根据各层当前的总比特数调整其正则项的强度，使得占用空间更大的层能得到更大的压缩。

随着我们训练的进行，我们会周期性的量化所有比特值，去掉全零的比特，改变某些层的精度。通过这种循环往复的方式，我们就可以得到一个最终的混合精度表示，并通过fine-tuning得到最终的模型。

Accuracy-#Bits Tradeoff

从效果上来说，我们这个BSQ方法很好的实现了模型性能与模型大小之间的trade off。可以看到随着我们使用不同regularization的强度，最后得到的模型各层精度分布符合一个稳定的趋势。当然随着regularization强度的不断增高，每一层被分配的bit数也不断减少。

另外我们发现，在同样的量化精度下，通过BSQ得到的模型准确率要高于直接从零训练的模型。这一点与之前工作对模型剪枝的观察：“从大模型剪枝出一个小模型，往往比将小模型从0开始训练能得到更好的效果”是一致的，这也进一步体现了我们BSQ方法的优势。

Comparing with SOTA Methods

下面列举了与之前方法的对比。

在相同性能下，压缩比更大。

Takeaways

• BSQ (ICLR 2021)

• 通过bit层面的结构化稀疏来进行权值精度的降低

• 实现了bit层面的Group Lasso

• 在训练过程中引导模型进行精度降低并最终得到一个混合精度的量化模型

我们最终也得到了一个超越之前方法的accuracy-efficiency tradeoff。

The Need of Real-World Application

现实环境的变化也给我们的神经网络部署提供了一定的需求。我们希望模型能具有更高的灵活性。

• 量化方案的灵活性

■ 运行时环境可能会发生变化

■ 低电量模式，内存不足等。

■ 最好让模型灵活到可以从一系列量化方案中选择

■ 量化感知训练不直接支持

• 推广到看不见的数据

■ 真实世界的输入不存在于训练集中

■ 需要模型泛化到新的输入

Unifying the Pursuit of Generalization and Quantization

我们希望找到一种方式，同时实现模型泛化能力和对不同量化精度鲁棒性的提升。

• Model generalizability (SAM, ICLR21’)

模型对L2的权重噪声越鲁棒，也就说明其泛化能力越强。

• Performance under quantization

综上，我们可以说模型在量化之下带来的性能损失是以最差情况下的L无穷权重噪声所带来的性能损失为上限的。

综合上面这两个观察，如果我们能够得到一个理论体系可以使得模型对任意的lp权重噪声去鲁棒的话，就能够同时提升模型的泛化能力和鲁棒性。

那么如何做到同时提升呢？

Improving Weight Perturbation Robustness

• Modeling perturbation strength lower-bound

为了方便后文的分析，这里我们先定义一个最小噪声强度的概念。我们希望可以找到一个最小的噪声强度使得模型损失函数增大超出我们容忍的范围。在这样的定义下，一个模型的最小噪声强度越大说明模型可以容忍强度越大的噪声，这就是我们优化的目标。

• Derive with Taylor expansion

我们计划使用泰勒展开对最小噪声强度进行分析。我们发现，无论对于哪种权重噪声，其最小值均和海森矩阵的最大特征值v有关，且随着v的增大单调递减。这就说明更小的海森矩阵特征值能够带来更高的模型对权重噪声的鲁棒性。

Hessian-Enhanced Robust Optimization (HERO)

• Hessian eigenvalue regularization

为了减小海森矩阵特征值，我们提出了一个新的正则项。鉴于神经网络海森矩阵的求解难度，我们通过对海森矩阵进行了差分近似，得到沿着特征值最大方向的海森矩阵特征值的估计。

• Gradient of regularization

在对这一正则项进行优化的过程中，我们进一步对其梯度求解进行了简化，以提升训练的效率。最终我们得到了下面梯度更新算法，也就是我们提出的Hessian Enhanced Robust Optimization (HERO)

• Overall optimization step

Theoretical Insight Verification

从实验结果而言，从训练效果上，随着训练的进行，尽管模型的海森特征值与泛化损失都在增大（神经网络一定程度的过拟合是不可避免的），HERO训练出来的网络与其他方法相比有着最小的Hessian norm和generalization gap，这也带来了最优的测试集上的表现，并印证了我们更小的海森特征值可以增强模型泛化能力的理论分析。

从最终得到的模型来看，HERO得到的模型收敛于更加平缓的极小值点，使得模型对权重噪声有更强的鲁棒性。

与之前提出的一阶正则项SAM相比，HERO进一步提升模型泛化能力，降低模型在量化过程中的损失，体现出HERO提出的二阶泰勒分析与正则项的不可或缺性。

Trained Model Performance

我们可以看到，HERO方法在测试集准确性与不同精度量化下的表现均优于之前的算法。

Takeaways

• HERO (DAC 2022)

■ 模型的generalization gap可以被ℓ2 权值噪声下的性能所限制

■ Uniform quantization等价于ℓ∞权值噪声下的表现

■ 在两种情况下，较小的Hessian特征值提高了权值扰动的鲁棒性

■ HERO既能提高测试精度，又对训练后量化具有更高的鲁棒性

对权重扰动鲁棒性的研究有助于获得精确的、硬件友好的DNN。

提

醒

论文题目：

BSQ: Exploring Bit-Level Sparsity for Mixed-Precision Neural Network Quantization (ICLR 2021)

HERO: Hessian-Enhanced Robust Optimization for Unifying and Improving Generalization and Quantization Performance (DAC 2022)

论文链接：

https://arxiv.org/abs/2102.10462

https://arxiv.org/abs/2111.11986

点击“阅读原文”，即可观看本场回放

整理：林则

作者：杨幻睿

往期精彩文章推荐

记得关注我们呀！每天都有新知识！

关于AI TIME

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。

迄今为止，AI TIME已经邀请了700多位海内外讲者，举办了逾300场活动，超260万人次观看。

我知道你

在看

哦

点击 阅读原文 查看回放！

蚂蚁集团可转正实习算法岗内推-自然语言飞300 业界资讯自然语言处理
具备极佳的工程实现能力，精通C/C++、Java、Pvthon、Perl等至少一门语言:对目前主流的深度学习平台:tensorflow、pytorch、mxnet等，至少对其中一个有上手经验;熟悉深度学习以及常见机器学习算法的原理与算法，能熟练运用聚类、分类、回归、排序等模型解决有挑战性的问题，有大数据处理的实战经验;有强烈求知欲，对人工智能领域相关技术有热情，内推链接：https://u.ali
深圳传音控股AI算法岗内推飞300 人工智能 python java 业界资讯
1扎实的数学基础，熟练掌握机器学习相关的数学知识。2熟悉常用的机器学习算法，掌握常用的深度学习模型与编程实践。3熟悉Pytorch或TensorFlow等深度学习框架，有一定项目经验。4良好的沟通协调能力，执着的专业精神。5参与部门AI创新项目，包括自动化测试平台、BPM流程管理等项目开发登录链接：transsion.zhiye.com/campus/jobs填写我的推荐码：EVHPB3投递，简历
小鹏P7自动泊车技术方案浅析 yuyuelongfly 自动驾驶小鹏P7 APA 自动泊车自动驾驶
目录一、概述二、感知算法1.视觉库位检测1.1.视觉系统1.2.库位检测算法1.3.同步建图与定位技术1.4.其他要素检测2.超声波库位检测3.视觉库位检测与超声波库位检测融合三、路径规划与控制四、HMI一、概述泊车算法离不开感知&融合、规划&控制，从目前行业技术发展的角度来看，泊车涉及的每一个算法都不算完美，甚至可以说仍不成熟。然而，小鹏P7采用优秀的系统方案设计，特别是通过引入同步建图与定位技
【北上广深杭大厂AI算法面试题】深度学习篇...MobileNet 系列网络发展与高效性分析（附代码）（二）努力毕业的小土博^_^ AI算法题库人工智能算法深度学习卷积神经网络
【北上广深杭大厂AI算法面试题】深度学习篇…MobileNet系列网络发展与高效性分析（附代码）（二）【北上广深杭大厂AI算法面试题】深度学习篇…MobileNet系列网络发展与高效性分析（附代码）（二）文章目录【北上广深杭大厂AI算法面试题】深度学习篇...MobileNet系列网络发展与高效性分析（附代码）（二）MobileNet系列网络发展与高效性分析（附代码）4.MobileNetV2（2
”天下第一神数“——紫微斗数的JAVA实现！紫微玄机速run~ 钮钴禄·爱因斯晨赛博算命JAVA实现 java python 开发语言
各位佬儿们好呀~~互三必回哦~更多精彩：个人主页赛博算命精彩文章：梅花易数的java实现赛博算命系列文章不作溢美之词，不作浮夸文章，此文与功名进取毫不相关也！与各位共勉！！文章目录#前言：一、紫微斗数简介二、紫微斗数的数学原理1.**命盘构建规则**2.**星曜分布算法**3.**运势推导逻辑**三、Java实现步骤1.代码分布实现1.1**数据结构设计**1.2**命盘构建算法实现**1.3**
小白必看！2025 网络安全保姆级学习路线来啦~ 白帽黑客-晨哥学习 web安全安全数据库 php
关键词：网络安全入门、渗透测试学习、零基础学安全、网络安全学习路首先咱们聊聊，学习网络安全方向通常会有哪些问题1.初学者常见问题1.1如何开始学习网络安全？问题：网络安全领域广泛，初学者往往不知道从哪里入手。解答：从基础知识开始：学习计算机网络、操作系统、编程语言（如Python、Bash）。了解网络安全的基本概念，如加密、认证、漏洞、攻击类型等。使用在线资源（如Cybrary、OWASP）或书籍
华为OD-不限经验，急招，机考资料，面试攻略，不过改推，捞人 2301_79125642 java
超星(学习通)-Java后端一面网易互娱40min（感觉是G了）一篇不太像面经的面经2023总结，前端大二上进小红书秋招面经第一波海康红外图像算法实习（微影）面经测试工程师社招-测试面试题大厂在职傻屌。TPlink图像算法工程师一二三面经深圳海康红外图像算法实习（微影）面经TPLink提前批面经（已OC）传统车辆转规控算法岗秋招记录腾讯TEG测试与质量管理全记录瑞幸Java开发校招一面腾讯金融科技
基于TableStore的海量气象格点数据解决方案实战阿里云云栖号数据存储与数据库 exception Java核心技术
前言气象数据是一类典型的大数据，具有数据量大、时效性高、数据种类丰富等特点。气象数据中大量的数据是时空数据，记录了时间和空间范围内各个点的各个物理量的观测量或者模拟量，每天产生的数据量常在几十TB到上百TB的规模，且在爆发性增长。如何存储和高效的查询这些气象数据越来越成为一个难题。传统的方案常常采用关系型数据库加文件系统的方式实现这类气象数据的存储和实时查询，这种方案在可扩展性、可维护性和性能上都
【MATLAB源码-第269期】基于matlab的鱼鹰优化算法(OOA)无人机三维路径规划，输出做短路径图和适应度曲线. Matlab程序猿小助手路径规划 matlab 算法开发语言人工智能无人机网络机器人
操作环境：MATLAB2022a1、算法描述鱼鹰优化算法（OspreyOptimizationAlgorithm，简称OOA）是一种新兴的基于自然界生物行为的智能优化算法，其灵感来自于鱼鹰这种海鸟在捕猎过程中的独特行为。鱼鹰是一种生活在全球范围内的猛禽，以鱼类为主食。它们的捕猎方式非常高效和精准，能够通过快速调整飞行路径和俯冲角度来捕捉猎物。鱼鹰的捕猎行为不仅表现出高度的灵活性，还能在不同环境中表
【MATLAB源码-第164期】基于matlab的轴承故障三种谱图：细化谱，功率谱，倒谱对比分析仿真。 Matlab程序猿小助手通信原理 matlab 开发语言算法机器人人工智能机器学习计算机视觉
操作环境：MATLAB2022a1、算法描述轴承故障分析是一种重要的维护和监控手段，能够帮助工程师及时发现和解决轴承在运行中可能遇到的各种问题。在轴承故障诊断中，通常会使用到三种谱图分析方法：细化谱（FineSpectrum）、功率谱（PowerSpectrum）和倒谱（Cepstrum）分析。这三种方法各有特点，适用于不同的故障类型和分析场景。以下是对这三种谱图的详细描述。细化谱分析理论基础细化
【MATLAB源码-第128期】基于matlab的雷达系统回波信号仿真，输出脉压，MTI,MTD等图像。 Matlab_猿助手调制解调通信原理 MATLAB matlab 开发语言信息与通信
操作环境：MATLAB2022a1、算法描述雷达（RadioDetectionandRanging）是一种使用无线电波来探测和定位物体的系统。它的基本原理是发射无线电波，然后接收这些波从目标物体上反射回来的信号。通过分析这些反射波，雷达能够确定物体的位置、速度、方向和其他特性。历史背景雷达技术起源于20世纪初。最初的发展动机主要是军事上的需求，特别是在第二次世界大战期间，雷达在侦测敌机和舰船上发挥
大数据与物联网（IoT）的完美融合：驱动智能新时代 Echo_Wish 大数据高阶实战秘籍大数据物联网 python 人工智能
大数据与物联网（IoT）的完美融合：驱动智能新时代大家好，我是你们的大数据探索者Echo_Wish。今天，我们将深入探讨大数据与物联网（IoT）整合的重要性及其在现代科技中的应用。物联网通过连接大量智能设备，生成海量数据；而大数据技术则赋予我们从这些数据中提取有价值信息的能力。当两者结合在一起时，能够为各行各业带来革命性的变化，推动智能时代的到来。一、大数据与物联网的基本概念1.物联网（IoT）物
三维模型点云化工具V1.0使用介绍：将三维模型进行点云化生成是刃小木啦~ python pyqt 工业软件软件工程
三维软件绘制的三维模型导入之后，可以生成点云，用于替代实际的激光扫描过程，当然，主要是用于点云算法的测试和验证，没法真正模拟扫描的效果，因为太过于理想化了。功能介绍将三维软件绘制的三维模型变成点云，并且支持不同的点云密度。支持添加不同的噪声，高斯噪声比较柔和，随机噪声比较明显。功能视频介绍三维模型点云化工具V1.0使用介绍：将三维模型进行点云化生成，支持不同的分辨率，支持添加噪声下载地址三维模型点
具身智能行业 [shenhonglei] 具身觉醒：智能进化的未来之路人工智能机器人
具身智能行业综合分析资源下载-具身智能导图.xmind资源下载-具身智能导图.xmind一、行业概况定义与核心特征具身智能（EmbodiedAI）指通过物理实体（如机器人、自动驾驶设备等）与环境的动态交互，实现感知、认知和行动控制的智能系统。其核心特征是“知行合一”，强调通过实际交互提升智能水平，而非仅依赖数据训练。技术融合：结合人工智能（AI）、机器人技术、多模态大模型
PCL 最小二乘拟合空间曲线点云侠点云进阶算法 c++计算机视觉 3d 开发语言
目录一、曲线拟合1、算法原理2、参考文献二、代码实现三、结果展示四、测试数据本文由CSDN点云侠原创，原文链接。如果你不是在点云侠的博客中看到该文章，那么此处便是不要脸的爬虫与GPT。博客长期更新，最近一次更新时间为：2024年7月14日。①代码在PCL1.14.1中运行；②完善代码；③新增标准测试数据一、曲线拟合1、算法原理电力线三维重建指将提取得到的单根电力线进行精确矢量化。在理想情况下，
【AGI】中国大模型扛把子：通义家族 LeeZhao@ AIGC重塑生活神器 agi 人工智能 AIGC 面试自然语言处理语言模型
中国大模型扛把子：通义家族引言一、通义千问的技术架构与模型谱系二、技术突破与性能优势三、开源生态与行业影响四、未来展望：从“千问时代”到通用智能五、通义家族大模型列表（1）多模态大模型（2）大语言模型结语引言在人工智能大模型领域，中国科技企业正以惊人的速度突破技术边界。阿里云推出的**通义千问（Qwen）**系列大模型，凭借其多层次的技术架构、多样化的模型生态及开源战略，已成为全球AI领域的重要标
DeepSeek开源技术全景解析：从硬件榨取到AI民主化革命大刘讲IT 开源人工智能
DeepSeek开源技术全景解析：从硬件榨取到AI民主化革命一、开源周核心成果概览2025年2月24日启动的"开源周"计划，DeepSeek团队连续发布三项底层技术突破：FlashMLA（2.24）：动态资源调度算法，Hopper架构GPU性能榨取专家DeepEP（2.25）：全球首个MoE全流程通信优化库DeepGEMM（2.26）：300行代码重构矩阵计算范式三项技术构成完整技术栈，覆盖大模型
分布式基本理论 - CAP,BASE 和 RAFT 算法 Yellow明算法分布式
分布式基本理论-CAP,BASE和RAFT算法1.分布式基本理论1.1CAP理论在理论计算机科学中，CAP定理（CAPtheorem），又被称作布鲁尔定理（Brewer’stheorem），它指出对于一个分布式计算系统来说，不可能同时满足以下三点：[1][2]一致性（Consistency）（等同于所有节点访问同一份最新的数据副本）可用性（Availability）（每次请求都能获取到非错的响应—
AdaBoost算法 Mr终游机器学习算法决策树
目录一、核心原理：二、算法步骤三、关键优势：四.局限与解决五、代码示例（鸢尾花数据集）AdaBoost（AdaptiveBoosting）是一种经典的集成学习算法，通过组合多个弱分类器（如决策树）来构建强分类器。其核心思想是通过迭代优化残差（错误）和动态调整样本权重，逐步提升模型性能。以下是对AdaBoost的简明总结和关键要点：一、核心原理：提升法：通过顺序训练多个弱分类器，每轮专注修正前一个模
常见的限流算法有哪些涛粒子算法 java 网络
计数器算法原理：在固定的时间窗口内，对请求进行计数，当请求数量达到设定的阈值时，就开始限流，拒绝多余的请求。例如，设定1分钟的时间窗口内允许最多100个请求，那么在这1分钟内每来一个请求，计数器就加1，当计数器达到100后，后续的请求就会被拒绝，直到下一个1分钟开始，计数器重置为0重新计数。优点：实现简单，易于理解和部署，在一些对精度要求不是特别高的场景下能很好地控制流量。缺点：存在临界问题，比如
探索数据仓库自动化：ETL流程设计与实践 Echo_Wish 大数据高阶实战秘籍数据仓库自动化 etl
探索数据仓库自动化：ETL流程设计与实践在大数据时代，数据仓库已成为企业数据管理和决策支持的核心工具。如何高效地提取、转换和加载数据（ETL），是数据仓库建设中的重要环节。本文将围绕数据仓库自动化的ETL流程设计展开，结合实际代码示例，探讨如何构建高效、稳定和可扩展的ETL解决方案。什么是ETL？ETL（Extract,Transform,Load）是指数据抽取、转换和加载，是数据仓库建设的重要步
代码随想录算法训练营第七天|Leetcode 344.反转字符串 541. 反转字符串II 卡码网：54.替换数字昂子的博客算法 leetcode java 数据结构
344.反转字符串建议：本题是字符串基础题目，就是考察reverse函数的实现，同时也明确一下平时刷题什么时候用库函数，什么时候不用库函数题目链接/文章讲解/视频讲解：代码随想录思路非常简单，两个指针一个指向头一个指向尾巴，对于字符串，我们定义两个指针（也可以说是索引下标），一个从字符串前面，一个从字符串后面，两个指针同时向中间移动，并交换元素。classSolution{publicvoidre
C++ 泛型编程四代目水门 C++学习笔记 c++开发语言
C++泛型编程一、泛型编程基础1.核心概念实现算法与数据结构的分离基于模板技术（函数模板/类模板）本质：类型参数化，减少重复代码典型应用：STL容器、迭代器、算法2.类型本质内存布局的抽象不同类型对应不同的内存分配策略二、函数模板1.基本语法cpptemplate//或template返回类型函数名(参数列表){//函数体}2.关键特性支持隐式推导和显式指定类型可重载（包括与普通函数重载）可声明为
字节跳动2024校招后端开发面试题大全（含解题思路） AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
字节跳动2024校招后端开发面试题大全（含解题思路）关键词：字节跳动、校招、后端开发、面试题、解题思路摘要：本文将围绕字节跳动2024校招后端开发面试题进行深入分析，包括数据结构与算法、编程语言基础、后端技术栈、微服务架构、系统设计与优化等方面的面试题。通过详细解析这些面试题，帮助读者理解解题思路，提升后端开发面试技能。字节跳动2024校招后端开发面试背景字节跳动（ByteDance）是中国领先的
JAVA排序荔枝吃吃 java 排序算法算法
1.冒泡排序/***使用冒泡排序算法对整数数组进行排序*冒泡排序是一种简单的排序算法，它重复地遍历要排序的数列，*一次比较两个元素，如果它们的顺序错误就把它们交换过来*遍历数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成*这个算法的名字由来是因为越小（或越大）的元素会经过交换慢慢“浮”到数列的顶端**@paramarr待排序的整数数组*/publicstaticvoidbubb
大语言模型对程序员行业的影响及未来发展走势分析 Hello kele 人工智能 java 人工智能 AI编程
随着人工智能技术的快速发展，特别是大语言模型（如DeepSeek、OpenAI、Grok等）的出现，对程序员这个行业产生了深远的影响。在这篇文章中，我们将探讨这些变化，分析影响，并展望未来的发展趋势。一、当前影响1.自动化代码生成大语言模型的一个直接影响是代码自动化的能力。这些模型可以理解代码上下文，并生成功能性代码。例如，GitHubCopilot已经成为许多开发者的辅助工具，能够根据注释或部分
DeepSeek：AI赋能的无限可能——从日常生活到职业进阶的全场景探索 Hello kele 人工智能人工智能
引言在人工智能技术飞速发展的今天，DeepSeek作为一款国产AI工具，凭借其强大的推理能力、自然语言处理效率和场景化应用潜力，正在重塑人类解决问题的方式。从撰写演讲稿到制定投资策略，从家庭教育到企业管理，DeepSeek通过“自然语言对话”的交互模式，将复杂任务简化为几步提示词的输入，真正实现了“所想即所得”。本文将从七大核心场景出发，系统解析DeepSeek如何成为个人与组织的智能助手，推动效
数据结构与算法--实现链表的复制(链表中节点比较特殊,含有一个rand指针,指向任意一个节点) 请叫我大虾数据结构链表数据结构
已在leetcode上执行通过//https://leetcode.com/problems/copy-list-with-random-pointer/leetcode地址publicclassCopyListWithRandom{publicstaticclassNode{intval;Nodenext;Noderandom;publicNode(intval){this.val=val;th
【贪心算法1】 m0_46150269 贪心算法算法
力扣455.分发饼干链接:link思路尽可能让更多人吃到饼干并且尽可能少的造成浪费，大尺寸饼干能满足大胃口的人就应该优先分给大胃口的人。所以先将饼干和胃口大小排序，然后从后往前遍历。但是这时候又有一个问题，饼干和胃口哪个作为for循环哪个作为if呢？答案是只能胃口作为for，饼干作为if，因为for循环的i是固定每次移动，而饼干index只有满足条件才会移动。这里可以举一个反例，如果最大胃口大于最
贪心算法-移除K个数字我是你的春哥！贪心算法算法 java
1、题目描述给定一个以字符串表示的非负整数num，移除这个数中的k位数字，使得剩下的数字最小。注意：num的长度小于10002且≥k。num不会包含任何前导零。2、题目分析：题目简介明了，就是把给定的数字删除指定个数的数字使删除之后的数字是同等位数数字中最小的那个。但是需要注意的是，题目中给的数字是字符串的形式并且输出结果也是字符串的形式，这就涉及到字符串和数字之间的相互转化问题。题目中要求删除的
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，Django@Python2.x 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

干货！面向低精度量化的神经网络训练算法

你可能感兴趣的:(神经网络,算法,人工智能,大数据,编程语言)