端木的AI探索屋

MIT-BEVFusion系列七--量化4 calibrate 标定与敏感层禁用（较重要）

- - 一、设置数据并行和评估模式
  - 二、加速校准计算
  - 三、校准模型
  - - 3.1 收集统计数据
    - - 3.1.1 禁用量化模式，启用校准模式
      - 3.1.2 收集统计数据
      - _input_quantizer
        
        _weight_quantizer
      - 3.1.3 启用量化模式，禁用校准模式
    - 3.2 计算最大值
    - - 对 calib.HistogramCalibrator 计算最大值
      - 对 calib.MaxCalibrator 计算最大值
  - 四、对敏感层的不进行量化
  - 五、融合 lidar backbone 中的 ReLU
  - - 当前模块属于 SparseSequential 并且第一个子模块属于 SparseConvolution
    - 当前模块属于SparseBasicBlock
  - 储存 PTQ 操作之后的 BEVFusion 模型
- 总结：

本文书接上回，替换层、conv与bn融合后，就要开启标定了。

标定这个步骤的结果，就是得到如下图onnx中qdq节点中的scale数值。

一、设置数据并行和评估模式

二、加速校准计算

这里主要找到所有 _input_quantizer 和 _weight_quantizer，将 _input_quantizer 中的_calibrator._torch_hist 设置为 True，之后在校准时会使用 pytorch 进行直方图计算，如果使用默认值 False 的话，就会使用 numpy 来计算直方图。这里不会对 _weight_quantizer 进行修改，是因为 _weight_quantizer._calibrator 属于 calib.MaxCalibrator这个类。

三、校准模型

校准模型分为两个部分：

收集统计数据
计算绝对最大值

3.1 收集统计数据

收集的功能，封装在函数collect_stats中。

3.1.1 禁用量化模式，启用校准模式

将模型切换到评估模式后，遍历模型中所有的子模块去寻找是否属于TensorQuantizer的子类。其实就是找量化层中的 _input_quantizer 和 _weight_quantizer，如果找到 _input_quantizer 和 _weight_quantizer，就将禁用量化模式(module.disable_quant)，启用校准模式(module.enable_calib)；

禁用量化模式就是将量化器中的 _if_quant 设置为 False。

启用校准模式就是将量化器中的 _if_calib 设置为 True。

这样在之后的 forward 中，就不会对数据进行量化操作，并且会收集数据用于校准。

3.1.2 收集统计数据

其实就是执行了模型的前向，因为quantizer中的collect开关打开了，前向的过程已经不是输入数据，得到result这么简单了。而是输入数据，每个quantizer都会收集流转到这里的数据的动态范围。

_input_quantizer

通常_input_quantizer 创建时使用per-tensor加histogram的方式。即每个激活的量化器使用直方图的方式收集数据，最终计算出一个scale。
第一次使用模块中的 _input_quantizer 收集数据时，量化器的校准器中并没有存储统计数据，即 _calib_hist 和 _calib_bin_edges 为 None，在进行统计数据收集时，直接将统计结果赋值给 _calib_hist，然后为 _calib_bin_edges 设置成一个长度为 2049 的张量，将0到输入数据x.max() 划分为 2049 个值。
- 其含义为 2048 个 bin 的 2049 个边界，即直方图的边界。
这里的 self._num_bins 为 2048 是因为在初始化校准器时，默认设置的数值为 2048，是 tensorrt 默认设置的统计直方图时的 bin 的个数。

除了第一次收集数据时会从零创建直方图，后续收集数据会更新第一次创建的直方图。
更新直方图的最大值：amax
更新直方图的边界的数值：_calib_bin_edges
更新直方图的 bin 的个数：_num_bins
111行判断当前数据的最大值与上一个统计的直方图的最大值哪个大。
113行在保证bins的width 没有变化的情况下计算出新的bins的数量。114行计算出边界。主要是 116-117 行代码，需要再原始的直方图 bin 的数值上，将前一次与本次的直方图数值进行累加。
如果这个模块中的 _input_quantizer 收集过数据，会先判断当前数据的最大值是否超过直方图的最大范围，超过了的话就会维持之前每个 bin 的区间，去扩充 bin 的数量到可以包容到现在数据的最大值。

之后会将之前统计的结果与当前统计的结果相加保存到 _calib_hist 中。

_weight_quantizer

使用模块中的 _weight_quantizer 收集数据时，先根据指定 axis 找出局部最大值。

通常对于2d卷积的权重来说，因为形状通常是[O,I,KH,KW]的，并且采用PER_CHANNEL的方式，所以通常指定axis为0，即最终计算得到O个（输出通道数量个）scale。

这个是对于 torch.nn 中一些常用的 module 的 weight 的量化描述器的配置，这里主要会使用针对 Conv2D 和 ConvTranspose2D 的量化描述器，针对 SparseConv 的量化描述器是自定义的，主要区别就是 axis 不同，这里值为4，通常对于SparseConv的权重，这个维度也是输出的维度，在之后统计 amax 时会根据这个 axis 来统计最大值。

这里就会遍历出了指定 axis 之外的所有维度，找出每个维度的最大值，这样最后就可以将其余维度的最大值保存在指定 axis 中，最后的形状会变成 [1, 1, 1, 1, ori]。

训练好的模型，权重是固定的。
_calib_amax用来储存权重最大值。
如果第一次使用 _weight_quantizer 的 _calibrator 来统计数据，即使用 dataloader 中的第一组数据放入 model 中进行前向，此时self._calib_amax是None（74行）那么会将局部最大值赋值给 _calib_amax(75行)。

如果 _calib_amax 已经存在数值，那么会从 local_amax 和 _calib_amax 中简单判断下获取最大值，并保存到 _calib_amax 中，正常情况下因为模型权重是固定的，一般不会发生变化。

3.1.3 启用量化模式，禁用校准模式

收集好数据后，以卷积为例，对于输入数据，每个quantizer都记录到了一个直方图_calib_hist，而对于权重来说，都记录到了_calib_amax 。

此时关闭calib开关（364行），开启quan开关（363行）。

3.2 计算最大值

对 calib.HistogramCalibrator 计算最大值

369 行，收集好数据后，开始计算amax，这里指定了方法是mse。

最终是在327行或者330行，调用自己的load_calib_amax去计算。

这里其实本质就是通过 quantizer 中的校准器来计算最大值，调用 _calibrator 中的 compute_amax 函数。

对于输入数据的统计来看，主要是走330行这个分支，调用直方图校准器的load_calib_amax方法

load_calib_amax方法内会调用self._calibrator.compute_amax

142 行得到直方图校准器中的直方图calib_hist，143行拿到bins的边界

HistogramCalibrator(num_bits=8 axis=None unsigned=False calib_bin_edges=tensor([0.0000e+00, 1.2891e-03, 2.5781e-03,  ..., 2.6374e+00, 2.6387e+00,
        2.6400e+00]) calib_hist=tensor([   0.,    0.,    0.,  ...,    0.,    0., 8679.], device='cuda:0'))

151行，走mse的分支，调用_compute_amax_mse，大概作用就是我们统计了所有训练集数据的分布，用直方图表示calib_hist表示，但我们最终需要的是从直方图中选取一个合适的最大值来作为输入数据的最大值，再去计算scale。

如何评价是否合适，就是选取多个候选值，分别把他们当成最大值，用mse的方式评估每个候选值的重投影误差，冲投影误差最小的作为真正选取的最大值。

264行，转换为 tensor
选用 mse (mean squared error) 进行数据校准。先将之前的统计数据与直方图边界转换为 tensor 和 float 类型，再通过边界计算每个 bin 的中点位置centers（266行）。

centers我们就是把centers中的值，作为标定的最大值calib_amax的候选值。

之后271行，就通过循环计算，从 128 到 2048，遍历第 128 之后的所有 bin，将当前 bin 的 center 作为 amax，在274行做fake_tensor_quant。

fake_tensor_quant中，大于amax的值都会作为异常值，大于 amax 的值在经过量化计算之后会被 clamp 操作根据最大最小值进行截断，这样原始数据大于 amax 的数值都会被设置为 127，在 dq 操作之后还原为与 amax 相近的数值。

之后计算 mse 的公式如下：

$\frac{1}{n}\sum_{i=128}^{2048}(fake - ori)^2*w$

276行，会根据 qdq 的结果与原始的数据计算它们之间的 mse，这里还会乘以一个权重 count 表示每个 bin 范围中的数据量，最终结果保存在 mses 中，当前 bin 的索引存储在 arguments 中。

在遍历完所有 bin 之后，挑选最小的 mse 数值对应的索引，并将对应的 bin 的 center 作为一个校准阈值。

如果当前 _input_quantizer 不存在 _amax 这个属性的话，就在该模块中添加一个 buffer，buffer['_amax'] 中存储着 `calib_amax.data```。这个最大值是作用于整个张量的。

337行，最后将 _amax 移到设备上。

对 calib.MaxCalibrator 计算最大值

权重数据的_weight_quantizer通常用MaxCalibrator。

调用compute_amax

因为权重是固定的，amax就是标定的_calib_amax

_weight_quantizer 的最大值就是之前根据校准数据收集到的最大值，是根据每个通道来提取的最大值。

此时，对于input、weight来说，都有了_amax 属性，但是qdq节点要用的是scale属性。

这个是在导onnx的时候，quant开关会打开，会自己计算的。
首先会走346行

然后导出onnx时，通常会开启pytorch自己的fake_quant，代码里会走314行。

在这里就能看到scale时如何计算的了。

四、对敏感层的不进行量化

这里猜测是根据试验和指标，总结出哪些层量化误差会很大，因此直接禁用了这些层的量化。

这里对 lidar backbone 的第一层稀疏卷积和 decoder 中的 SECONDFPN 的第一个二维卷积取消量化操作。

147 行执行前后对比
148 行执行前后对比

五、融合 lidar backbone 中的 ReLU

主要是将模块中的 SparseConvolutionQuant 与 ReLU 进行融合。

当前模块属于 SparseSequential 并且第一个子模块属于 SparseConvolution

198-199 代码逻辑，因为稀疏卷积和 bn 已经融合过了，所以此时 SparseSequential 内只有稀疏卷积 SparseConvolutionQunat 和 ReLU 两个层。
将量化的稀疏卷积模块的 act_type 属性设置为 “ReLU”
- 原始稀疏卷积就有 act_type 这个属性。SparseConvolution 中可以设置参数，直接达到融合的效果。https://github.com/traveller59/spconv/blob/125a194d895b1bc3ad6ff907bc72641548397b32/spconv/pytorch/conv.py#L337
- 稀疏卷积的卷积操作调用 _conv_forward
- _conv_forward 会调用 _apply_act。其中 F 是 nn 的 function
过程
- 第一次递归 set_attr_by_path(model, name, c)
  - model:SparseEncoder
    - 11Explain_Quantization2/6resnet.ipynb
  - name:'conv_input'
  - c:

SparseConvolutionQunat(
(_input_quantizer): TensorQuantizer(disabled)
(_weight_quantizer): TensorQuantizer(disabled)
)

- return 调用`set_attr_by_array(m, path.split("."))`
	- m:`SparseEncoder`
	- path:`'conv_input'`
- 执行`set_attr_by_array(parent, arr)`
	- parent:`SparseEncoder`
	- arr:`['conv_input']`

修改前后对比
- 最原始：
- conv与bn融合后
- conv与ReLU融合后
结果
1. 使用了setattr()将conv_input从SparseSequential替换为SparseConvolutionQuant
2. SparseConvolutionQuant中act_type属性设置为"ReLU"
3. 原先的ReLU()层被取消。但是inpalce属性仍会设置为False

当前模块属于SparseBasicBlock

会调用如下函数fuse_sparse_basic_block

new_sparse_basic_block_forward

最原始的SparseBasicBlock的forward

将替换后的new_sparse_basic_block_forward的初始化的is_fuse_relu属性置为True。
1. 这么做，等到new_sparse_basic_block_forward的forward时就不会执行ReLU操作
block 中的第一个 SparseConvolutionQuant 的 act_type 属性设置为 “ReLU”
- ps:forward是在融合bn时替换的。
原先的ReLU()设置为False

储存 PTQ 操作之后的 BEVFusion 模型

PTQ 量化之后的模型储存为 qat/ckpt/bevfusion_ptq.pth。

总结：

在默认的 _DEFAULT_QUANT_MAP 中添加了 ConvTranspose2d 的量化模块，并为所有在 _DEFAULT_QUANT_MAP 中的量化模块设置输入量化器的描述器，主要是设置校准方法为 histogram。
生成训练数据的 dataset和 dataloader加载模型和预训练权重。标定时使用data_loader_train训练数据标定。
对模型进行量化，主要对 lidar.backbone、camera、fuser、decoder 进行了量化
- 对 lidar.backbone 进行量化需要自定义一个针对稀疏卷积的量化模块 SparseConvolutionQuant，与原生的稀疏卷积模块的区别在于添加了对输入和权重的量化描述器(QuantDescriptor)，输入的校准方法为 histogram，权重的量化维度设为 4，前向操作中会先对输入和权重通过对应的量化器进行前向，然后进行原生的稀疏卷积模块的前向。
- 先将 lidar.backbone 中的所有 spconv.SubMConv3d 和 spconv.SparseConv3d 模块替换为 SparseConvolutionQuant 模块，并将原来模块中的所有属性赋值到这个量化模块中，之后通过前面提到输入和权重的量化描述器创建输入与权重的量化器。
- lidar.backbone 中的所有 SparseBasicBlock 模块中添加了自定义的 QuantAdd 模块，用于替换原来的残差操作，主要是对输入使用相同的输入量化器，用于保证输入具有相同的精度，防止出现 reformat 的情况。
  - forward替换为new_sparse_basic_block_forward。方便后续融合bn与relu。
- 对 camera 中的 backbone (Resnet50)、neck (FPN) 和 vtransform (Downsample) 进行了量化。
- 遍历 camera.backbone 中的所有子模块，如果当前模块属于的类的对象在 _DEFAULT_QUANT_MAP 的 orig_mod 中，那么就会将这个模块替换为相应的量化模块，主要是将 nn.Conv2d 替换为 quant_nn.QuantConv2d。
- 对 camera.backbone 中的 Bottleneck 模块中的残差结构也需要对精度对齐，其中包含了具有 Downsample 模块时进行加法和不具有 Downsample 模块时进行加法这两种情况。Resnet50 中的 4 个层，分别包含 3、4、6、3 个 Bottleneck 模块。
- 对 camera.neck 量化的话也是遍历所有子模块，将其中的 nn.Conv2d 替换为了 quant_nn.QuantConv2d，然后在 camera.neck 中添加了两个属性用于存储 QuantConcat，并替换了整个模块的 forward 函数，最主要的区别就是将原来的 Concat 操作替换为了 QuantConcat 操作。
- 对 camera.vtransform 量化就是对其中的 dtransform 和 depthnet 这两个模块进行量化，具体来说就是将其中的 nn.Conv2d 模块替换为 quant_nn.QuantConv2d 模块。
- 最后手动对 camera.backbone 的 3 个输出在 camera.neck 中进行拼接时的量化器设置为相同的。
- 对 model.fuser 的量化是将其中的 nn.Conv2d 替换为 quant_nn.QuantConv2d。
- 对 model.decoder 的量化时将其中的 nn.Conv2d 替换为 quant_nn.QuantConv2d，nn.ConvTranspose2d 替换为 quant_nn.QuantConvTranspose2d。
对 lidar.backbone 应用 SparseConvolution 与 bn 融合的操作，权重shape维度变化。
模型进入eval()模式，使用训练集进行calibrate操作。
敏感层分析没有在这里做，但是结论是需要将model.module.encoders.lidar.backbone.conv_input与model.module.decoder.neck.deblocks[0][0]禁用量化。
最后融合conv-relu

通常会使用闭包特性来实现递归操作。

def quantize_sparseconv_module(model):
    def replace_module(module, prefix=""):
        for name in module._modules:
            submodule = module._modules[name]
            submodule_name = name if prefix == "" else prefix + "." + name
            replace_module(submodule, submodule_name)

            if isinstance(submodule,  spconv.SubMConv3d) or isinstance(submodule, spconv.SparseConv3d):
                module._modules[name]  = transfer_spconv_to_quantization(submodule, SparseConvolutionQunat)
    replace_module(model)

你可能感兴趣的:(目标检测,pytorch,自动驾驶,论文阅读)

OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
2018 MacBook Pro 安装cuda+cuDNN+pytorch
2018MacBookPro安装cuda+cuDNN+pytorch根据CSDN上的两篇文章和知乎上的一篇文章，前前后后折腾了好几天，在一个小姐姐的帮助下终于装上了。我的环境系统版本：macOS10.13.6(17G10021)GPUDriverVersion:387.10.10.10.40.133CUDADriverVersion:410.130CUDA：cuda_10.0.130cuDNN：c
智能喷洒机器人目标识别系统：基于NanoDet的目标检测与UI界面实现 YOLO实战营机器人目标检测 ui NanoDet 计算机视觉目标跟踪深度学习
在现代农业生产中，自动化喷洒系统是实现精准农业的重要组成部分。智能喷洒机器人通过图像识别和自动控制技术，能够高效识别并精确喷洒农药、肥料等，提高农业生产效率，降低化学品使用量，减少环境污染。目标识别是智能喷洒机器人中至关重要的部分，它涉及到精准的作物和病虫害识别，确保喷洒操作的准确性。在本篇博客中，我们将构建一个基于NanoDet深度学习目标检测模型的智能喷洒机器人目标识别系统。我们将介绍如何使用
横幅检测数据集-1500张图片智慧城市管理活动现场管理商业广告分析
横幅检测数据集-1500张图片已发布目标检测数据集合集（持续更新）️横幅检测数据集介绍数据集概览检测目标类型应用场景数据样本展示使用建议1.数据预处理优化2.模型训练策略3.实际部署考虑4.应用场景适配5.性能优化建议数据集特色商业价值技术实现路径模型选择建议特殊技术考虑集成方案建议应用效果评估性能指标建议业务价值指标YOLOv8训练实战1.环境配置安装YOLOv8官方库ultralytics2.
机器人工程专业本科阶段的学习分析(腾讯元宝)
机器人工程专业作为新兴的多学科交叉领域，本科阶段的学习既有显著优势，也存在一定挑战。以下是具体的利弊分析，供学生参考：一、优势（利）1.就业前景广阔，薪资竞争力强行业需求旺盛：智能制造、医疗机器人、自动驾驶等领域人才缺口大（中国机器人产业联盟预测未来5年人才缺口超500万）。薪资水平较高：应届生起薪普遍高于传统工科（如机械、电子），一线城市平均月薪可达1.2万~2万元（2024年数据）。职业选择多
【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
旋转目标检测：Deep Spatial Feature Transformation for Oriented Aerial Object Detection【方法解析】沉浸式AI 《AI与SLAM论文解析》人工智能计算机视觉旋转目标检测
DeepSpatialFeatureTransformationforOrientedAerialObjectDetection目录DeepSpatialFeatureTransformationforOrientedAerialObjectDetection摘要关键词引言相关工作旋转对齐模块特征对齐方法旋转对齐模块特征选择模块摘要航空图像中的目标检测在计算机视觉领域引起了广泛关注。不同于自然图像
推荐项目： Few-Shot-Adversarial-Learning-for-face-swap 邱晋力
推荐项目：Few-Shot-Adversarial-Learning-for-face-swap去发现同类优质开源项目:https://gitcode.com/1、项目介绍Few-Shot-Adversarial-Learning-for-face-swap是一个基于PyTorch的开源实现，重演了三星AI实验室的一项前沿研究——“Few-ShotAdversarialLearningofReal
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
Hadoop与图像识别与处理 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Hadoop与图像识别与处理作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在大数据时代，数据的爆炸性增长对数据处理技术提出了新的挑战。图像数据作为一种重要的数据形式，其处理和分析在许多领域中具有重要意义，如医疗影像分析、自动驾驶、安防监控等。然而，传统的图像处理方法在面对海量图像数据时显得力不从心。Hadoop作为一种分
论文阅读：LLaVA1.5：Improved Baselines with Visual Instruction Tuning 微风❤水墨 LLM &AIGC &VLP LLM
论文：https://arxiv.org/abs/2310.03744代码：https://github.com/haotian-liu/LLaVA#train微调：https://github.com/haotian-liu/LLaVA/blob/main/docs/Finetune_Custom_Data.md模型论文时间VisionEncoderVLAdapterProjectionLaye
PyTorch生成式人工智能（18）——循环神经网络详解与实现盼小辉丶 pytorch rnn 自然语言处理
PyTorch生成式人工智能（18）——循环神经网络详解与实现0.前言1.文本生成的挑战2.循环神经网络2.1文本数据2.2循环神经网络原理3.长短期记忆网络3.自然语言处理基础3.1分词3.2词嵌入3.3词嵌入在自然语言处理中的应用小结系列链接0.前言我们已经学习了如何生成数字和图像等内容。从本节开始，我们将主要聚焦于文本生成。人类语言极其复杂且充满细微差别，不仅仅涉及语法和词汇的理解，还包括上
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
为什么用Pytorch帮客户训练好了模型还要提供模型结构？ yuanpan pytorch 人工智能机器学习
如果我在训练模型后生成好了一个模型文件：mnist_model.pth我想把这个模型文件给第三方使用，而不告诉他模型定义的结构等信息，那么第三方是不是就用不起来这个模型？答案：是的。如果只提供.pth文件而不告知模型结构，第三方确实无法直接使用该模型。原因和解决方案如下：1.为什么无法直接使用？.pth文件仅保存参数：torch.save(model.state_dict(),'mnist_mod
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
智能体学习记录一罗同学213 学习
智能体是什么智能体（IntelligentAgent）是一种能够感知周围环境、自主决策并执行行动以实现特定目标的智能化系统或程序。它可以是软件（如聊天机器人）、硬件（如机器人），或两者结合的实体，核心特征包括：自主性：无需人工实时干预，独立运行（如自动驾驶车辆避障）。反应性：实时感知环境变化并快速响应（如智能家居调节温度）。目标导向：基于预设目标优化行动（如推荐系统最大化用户点击率）。学习能力：通
autodl云计算平台使用ollama 部署lightrag 加入streamlit界面 42fourtytoo 云计算深度学习 pytorch 学习
1到autodl的算力市场里开一台机器镜像选择：PyTorch2.3.0、Python3.12(ubuntu22.04)、Cuda12.1我本来选择的Cuda12.4，但版本过高疑似会使ollama不使用GPU而只用CPU，后来换个镜像就好了2下载lightrag从lightrag的GitHub界面下载zip开机，上传zip，解压到autodl-tmp/lightrag下安装依赖，在文件夹下：pi
opencv、torch、torchvision、tensorflow的区别
一、框架定位与核心差异PyTorch动态计算图：实时构建计算图支持Python原生控制流（如循环/条件），调试便捷。学术主导：2025年工业部署份额24%，适合快速原型开发（如无人机自动驾驶、情绪识别）。TensorFlow静态计算图优化：预编译图结构提升部署效率支持动态图（Eager模式）兼顾灵活性。工业部署首选：市场份额38%，擅长边缘计算（YOLO部署）和大规模项目（工业自动化）-59）。O
PyTorch笔记6----------神经网络案例 HuashuiMu花水木 PyTorch笔记 pytorch 笔记
1.回归网络波士顿房价预测模型搭建波士顿房价数据集下载链接：百度网盘请输入提取码提取码:5279导入所需包importtorchimportnumpyasnpimportre读取数据ff=open('housing.data').readlines()data=[]foriteminff:out=re.sub(r"\s{2,}","",item).strip()#通过正则表达式去除所有空格data
大盘依旧低迷，二胎和自动驾驶活跃虚拟大师
本周来看，大盘依然不温不火，呈现箱形震荡。很多人都在打赌，沪指在上周调整之后有望突破新高，其实不然，目前的沪指基本上很难回复到以前的高位，甚至不会有向上突破的趋势，而且目前大盘的题材不鲜明，权重股没有扛起反攻的大旗。近期来看，二胎在本周表现强势，掀起几度涨停狂潮，金发拉比10天9板，成为目前的市场总龙头（目前已经停牌核查）。与之跟随的是贝因美，高乐股份，安奈儿等。目前我国的生育大家都心知肚明，所以
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
使用UV管理PyTorch项目
PyTorch是深度学习研究和开发的流行选择。可以使用uv管理PyTorch项目，包括不同Python版本依赖、管理环境、甚至加速器选择等。安装Pytorch从打包角度来看，PyTorch有几个不常见的特点：许多PyTorchwheel托管在专门的索引上，而非Python包索引（PyPI）。因此，安装PyTorch通常需要配置项目使用PyTorch专属索引。PyTorch为每种加速器生成不同的构建
YOLOv5改进策略|YOLOv5 ⾃主检查和跟踪相关的任务|基于视觉的⽆⼈⽔⾯舰艇⾃主导航极端海洋条件斌擎人工智能官方账号 YOLO 人工智能 YOLOv5 目标检测计算机视觉深度学习自主导航
目录介绍解决方案目标检测的视觉结论视觉感知是无人水面舰艇(USV)自主导航的重要组成部分，特别是与自主检查和跟踪相关的任务。这些任务涉及基于视觉的导航技术来识别导航目标。海洋环境中极端天气条件下的能⻅度降低使得基于视觉的方法难以正常工作。为了克服这些问题，本文提出了一种基于视觉的自主导航框架，用于在极端海洋条件下跟踪目标物体。所提出的框架由一个集成感知管道组成，该管道使用生成对抗网络(GAN)来消
AI新纪元：2025年深度学习技术突破与行业应用全景像素笔记杂谈人工智能深度学习 ai 自动驾驶工业数字化转型未来趋势技术创新
2025年，人工智能技术迎来爆发式增长，大模型、生成式AI和多模态技术持续突破，人形机器人量产元年正式开启，自动驾驶商业化进程加速，工业数字化转型全面铺开。这些进展不仅重塑了技术边界，更在多个行业创造了实际价值，推动AI从实验室走向产业化。本文将深入剖析2025年深度学习与AI领域的核心技术突破、行业应用案例及未来发展趋势，为技术从业者提供全面视角。一、深度学习核心技术突破：大模型、生成式AI与多
3步实现安防高精度检测：陌讯算法夜间监控落地实战 2501_92474745 目标跟踪人工智能计算机视觉算法目标检测视觉检测
开篇痛点：安防监控系统在实时目标检测中常面临严峻挑战。实测数据显示，传统算法在低光、遮挡或动态场景下，泛化能力不足，导致平均误报率高达15%（数据来源：安防行业报告）。尤其在夜间或拥挤环境下，系统卡顿、漏检频发，不仅降低响应效率，还增加安全隐患。例如，某城市交通监控中心反馈，其开源模型在高密度人流中出现每秒帧率（FPS）骤降至20帧以下，引发报警延迟问题。这些问题根源在于算法鲁棒性和实时性不足，亟
模型移植实战：从PyTorch到ONNX完整指南慕婉0307 神经网络 pytorch 人工智能 python
一、认识ONNXONNX（OpenNeuralNetworkExchange）是一种开放的模型表示格式，由微软和Facebook（现Meta）在2017年共同推出，旨在解决深度学习模型在不同框架之间的互操作性问题。ONNX的主要优势包括：跨框架兼容性：支持主流深度学习框架间的模型转换，包括PyTorch、TensorFlow、MXNet、CNTK等例如，可以将PyTorch训练的ResNet模型导
PyTorch的基础概念和复杂模型的基本使用香蕉可乐荷包蛋 AI大模型项目中的使用 pytorch 人工智能 python
文章目录一、PyTorch基础概念二、复杂模型的学习使用一、PyTorch基础概念张量（Tensor）操作：张量是PyTorch中的基本数据结构，类似于NumPy的数组，但支持GPU加速常见操作包括创建张量、张量运算、索引、切片等importtorch#创建张量x=torch.randn(3,4)y=torch.zeros(3,4)#张量运算z=x+y自动求导（Autograd）：PyTorch的
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号