wa1tzy

DeepLearing—CV系列（十三）——YOLOv4完整核心理论详解

文章目录

一、结构

1.1 网络结构图
1.2 YOLOv4的PAN结构
1.3 激活函数的思考

1.3.1 Mish激活函数
1.3.2 Swish激活函数

二、损失

2.1 L1、L2、SMOPTH_L1
2.2 IOU_LOSS的问题
2.3 GIOU_Loss
2.4 DIOU_Loss
2.5 CIOU_Loss
2.6 DIOU_nms

三、训练

3.1 Dropblock
3.2 Mosaic数据增强
3.3 SAT自对抗训练（Self-adversarial-training）
3.4 CmBN
3.5 modified SAM
3.6 modified PAN

四、效果

YOLOv4论文链接：YOLOv4: Optimal Speed and Accuracy of Object Detection
先放上思维导图，需要原图的可以留言~

一、结构

1.1 网络结构图

YOLOv4 包含以下三部分：
backbone网络：CSPDarknet53
Neck：SPP、PAN
Head：YOLOv3

Yolov4的五个基本组件：
1）CBM：Yolov4网络结构中的最小组件，由Conv+Bn+Mish激活函数三者组成。
2）CBL：由Conv+Bn+Leaky_relu激活函数三者组成。
3）Res unit：借鉴Resnet网络中的残差结构，让网络可以构建的更深。
4）CSPX：借鉴CSPNet网络结构，由三个卷积层和X个Res unint模块Concate组成。（尺寸转换可以用这个思想）
5）SPP：采用1×1，5×5，9×9，13×13的最大池化的方式，进行多尺度融合。
个人认为：CSPX结构里下面的CBM应该改为卷积，这点在YOLOv5里面有体现，因为有激活会产生非线性，有可能会梯度弥散，我会在下一篇博文介绍。
设计组件：不同大小的卷积核卷积、空洞卷积、池化等，最后用Maxout（像素选最大的）、Concate、Add
其他基础操作：
1）Concat：张量拼接，维度会扩充，和Yolov3中的解释一样，对应于cfg文件中的route操作。
2）add：张量相加，不会扩充维度，对应于cfg文件中的shortcut操作。

1.2 YOLOv4的PAN结构

FPN+PAN借鉴的是18年CVPR的PANet，当时主要应用于图像分割领域，但Alexey将其拆分应用到Yolov4中，进一步提高特征提取的能力。
原本的PANet网络的PAN结构中，两个特征图结合是采用shortcut操作，而Yolov4中则采用concat操作，特征图融合后的尺寸发生了变化。

1.3 激活函数的思考

激活函数的表达能力与级数有关，sigmoid表达能力很强，因为它求导还是它本身，二阶导还是它本身，可以无限导下去。
Sigmoid的缺点：容易饱和，就容易梯度弥散，不好训练，但sigmoid训练出来的网络能力一定很强。

Relu的表达能力很弱，一阶导为1。但不容易梯度弥散。
网络结构大的原因：Relu很弱，需要设计很多网络增强其非线性。所以需要设计其表达能力变强。

AI的本质：把低维度非线性不可分问题转为高维度线性可分问题，所以要用激活函数，维度越高，越容易线性可分。
重要！！！！！！：激活函数可以拼凑出来，相乘得到新激活函数
关于激活函数，大家可以看这篇文章：激活函数(ReLU, Swish, Maxout)

1.3.1 Mish激活函数

Yolov4的Backbone中都使用了Mish激活函数，而后面的网络则还是使用leaky_relu函数。

橙色曲线为：ln(1+e^(x))
蓝色曲线为：Mish函数
mish函数的Pytorch实现：

import numpy as np
from matplotlib import pyplot as plt


def mish(x):
    return x * np.tanh(np.log(1 + np.exp(x)))

x = np.linspace(-10, 10, 1000)
y = []
z = []
for i in x:
    y.append(mish(i))
plt.plot(x, y)
plt.grid()
plt.show()

1.3.2 Swish激活函数

二、损失

2.1 L1、L2、SMOPTH_L1

L1损失：不重要的权重被压成0，重要的权重保存下来，导致网络退化；经常用L1损失做剪枝。梯度不变，开始收敛还可以，学习率一样的话在下面容易震荡

L2损失：不重要的权重被压小到0附近，重要的权重被保留或放大。训练时，远的点先收敛较快，再收敛稳定。远的点梯度太大，容易崩掉；且对噪音比较敏感，噪音的点往往比较远，导致训练不稳定。

SMOPTH_L1损失：远处用L1，近处用L2

2.2 IOU_LOSS的问题

问题1：即状态1的情况，当预测框和目标框不相交时，IOU=0，无法反应两个框距离的远近，此时损失函数不可导，IOU_Loss无法优化两个框不相交的情况。

问题2：即状态2和状态3的情况，当两个预测框大小相同，两个IOU也相同，IOU_Loss无法区分两者相交情况的不同。

损失是需要找到一个方向，不断靠近，AI要选择一个方向进行靠近。

2.3 GIOU_Loss

1）GIOU的公式：

先计算两个框的最小闭包区域面积 [公式] (通俗理解：同时包含了预测框和真实框的最小框的面积)，再计算出IoU，再计算闭包区域中不属于两个框的区域占闭包区域的比重，最后用IoU减去这个比重得到GIoU。
2）GIOU的不足：

问题：状态1、2、3都是预测框在目标框内部且预测框大小一致的情况，这时预测框和目标框的差集都是相同的，因此这三种状态的GIOU值也都是相同的，这时GIOU退化成了IOU，无法区分相对位置关系。基于这个问题，2020年的AAAI又提出了DIOU_Loss。（框的损失没有方向了）

3）GIOU_LOSS：

2.4 DIOU_Loss

好的目标框回归函数应该考虑三个重要几何因素：重叠面积、中心点距离，长宽比。
针对IOU和GIOU存在的问题，作者从两个方面进行考虑

一：如何最小化预测框和目标框之间的归一化距离？
二：如何在预测框和目标框重叠时，回归的更准确？

针对第一个问题，提出了DIOU_Loss

1）DIOU的公式：

其中， [b] ， [b^gt] 分别代表了预测框和真实框的中心点，且 [ρ] 代表的是计算两个中心点间的欧式距离。 [c] 代表的是能够同时包含预测框和真实框的最小闭包区域的对角线距离。

2）DIOU的不足：
DIOU_Loss考虑了重叠面积和中心点距离，当目标框包裹预测框的时候，直接度量2个框的距离，因此DIOU_Loss收敛的更快。

但就像前面好的目标框回归函数所说的，没有考虑到长宽比。
比如上面三种情况，目标框包裹预测框，本来DIOU_Loss可以起作用。

但预测框的中心点的位置都是一样的，因此按照DIOU_Loss的计算公式，三者的值都是相同的。针对这个问题，又提出了CIOU_Loss

3）GIOU_LOSS：

2.5 CIOU_Loss

1）CIOU的公式：

其中 α 是用于做trade-off的参数，v是用来衡量长宽比一致性的参数。
2）GIOU_LOSS：

关于IOU_LOSS的详细介绍可以转到这篇文章查看IoU、GIoU、DIoU、CIoU损失函数的那点事儿

2.6 DIOU_nms

Nms主要用于预测框的筛选，常用的目标检测算法中，一般采用普通的nms的方式，Yolov4将其中计算IOU的部分替换成DIOU的方式：

这里为什么不用CIOU_nms，而用DIOU_nms?

因为前面讲到的CIOU_loss，是在DIOU_loss的基础上，添加的影响因子，包含groundtruth标注框的信息，在训练时用于回归。但在测试过程中，并没有groundtruth的信息，不用考虑影响因子，因此直接用DIOU_nms即可。

三、训练

3.1 Dropblock

Yolov4中使用的Dropblock，其实和常见网络中的Dropout功能类似，也是缓解过拟合的一种正则化方式。统的Dropout很简单，一句话就可以说的清：随机删除减少神经元的数量，使网络变得更简单。

Dropblock在2018年提出，论文地址:https://arxiv.org/pdf/1810.12890.pdf
传统的Dropout很简单，一句话就可以说的清：随机删除减少神经元的数量，使网络变得更简单。而Dropblock和Dropout相似，比如下图：

中间Dropout的方式会随机的删减丢弃一些信息，但Dropblock的研究者认为，卷积层对于这种随机丢弃并不敏感，因为卷积层通常是三层连用：卷积+激活+池化层，池化层本身就是对相邻单元起作用。而且即使随机丢弃，卷积层仍然可以从相邻的激活单元学习到相同的信息。
因此，在全连接层上效果很好的Dropout在卷积层上效果并不好。所以右图Dropblock的研究者则干脆整个局部区域进行删减丢弃。

这种方式其实是借鉴2017年的Cutout数据增强的方式，cutout是将输入图像的部分区域清零，而Dropblock则是将Cutout应用到每一个特征图。而且并不是用固定的归零比率，而是在训练时以一个小的比率开始，随着训练过程线性的增加这个比率。

Dropblock的研究者与Cutout进行对比验证时，发现有几个特点：

优点一：Dropblock的效果优于Cutout
优点二：Cutout只能作用于输入层，而Dropblock则是将Cutout应用到网络中的每一个特征图上
优点三：Dropblock可以定制各种组合，在训练的不同阶段可以修改删减的概率，从空间层面和时间层面，和Cutout相比都有更精细的改进。

Yolov4中直接采用了更优的Dropblock，对网络的正则化过程进行了全面的升级改进。

3.2 Mosaic数据增强

Yolov4中使用的Mosaic是参考2019年底提出的CutMix数据增强的方式，但CutMix只使用了两张图片进行拼接，而Mosaic数据增强则采用了4张图片，随机缩放、随机裁剪、随机排布的方式进行拼接。

为什么要进行Mosaic数据增强？
在平时项目训练时，小目标的AP一般比中目标和大目标低很多。而Coco数据集中也包含大量的小目标，但比较麻烦的是小目标的分布并不均匀。
首先看下小、中、大目标的定义： 2019年发布的论文《Augmentation for small object detection》对此进行了区分：

可以看到小目标的定义是目标框的长宽0×0~32×32之间的物体。但在整体的数据集中，小、中、大目标的占比并不均衡。

如上表所示，Coco数据集中小目标占比达到41.4%，数量比中目标和大目标都要多。
但在所有的训练集图片中，只有52.3%的图片有小目标，而中目标和大目标的分布相对来说更加均匀一些。针对这种状况，Yolov4的作者采用了Mosaic数据增强的方式。

主要有几个优点：

1）丰富数据集：随机使用4张图片，随机缩放，再随机分布进行拼接，大大丰富了检测数据集，特别是随机缩放增加了很多小目标，让网络的鲁棒性更好。
2）减少GPU：可能会有人说，随机缩放，普通的数据增强也可以做，但作者考虑到很多人可能只有一个GPU，因此Mosaic增强训练时，可以直接计算4张图片的数据，使得Mini-batch大小并不需要很大，一个GPU就可以达到比较好的效果。

此外，发现另一研究者的训练方式也值得借鉴，采用的数据增强和Mosaic比较类似，也是使用4张图片（不是随机分布），但训练计算loss时，采用“缺啥补啥”的思路：
如果上一个iteration中，小物体产生的loss不足（比如小于某一个阈值），则下一个iteration就用拼接图；否则就用正常图片训练，也很有意思。

3.3 SAT自对抗训练（Self-adversarial-training）

第一个阶段中，神经网络更改原始图像；第二阶段中，训练神经网络以正常方式在修改后的图像上执行目标检测任务。
安全相关：攻击网络；前向计算得到结果，反向传播时：图片当变量，用梯度反算回去加噪声。

什么是对抗样本
简单的说，就是会使得机器学习的算法产生误判的样本。比如下图

2014年，Anh Nguyen，Jason Yosinki，Jeff Clune发表论文Deep Neural Networks are Easily Fooled，构造了一类“对抗样本”。机器视觉在这些样本上会产生戏剧性的错误。如图，深度神经网络把左图看成狗，右图看成鸵鸟。

为什么会产生对抗样本
训练样本集不可能覆盖所有的可能性，并且很可能只能覆盖一小部分，所以不可能从中训练出一个覆盖所有样本特征的模型
用模型训练分类问题的时候，目标是如何更好的分类，所以模型会尽量扩大样本和boundary之间的距离，扩大每一个class区域的空间。这样做的好处是让分类更容易，但坏处是也在每一个区域里包括了很多并不属于这个class的空间。

如上图，蓝色为数据的真实决策边界（real decision boundary）,红色为模型的决策边界（model decision boundary）。可以发现，基于图中已有的数据集，红线已经是一条最后的决策边界了，但是离真实的决策边界依然有很多差别的地方，当维数增加，这样的差别会变得更加的大，也就是说会有许多的对抗样本存在。

模型的鲁棒性
因为对抗样本的存在，我们有必要对机器模型的评判提供一个新的评判标准，用于分析模型对于微小扰动的抵抗能力。使得模型误判需要的扰动幅度越大，那么说明模型的鲁棒性越好。

生成对抗样本的方法简介
在一个黑盒攻击中，我们能够得知模型对应的输入输出，由于对抗样本存在的必然性，理论上，我们只需要在原样本中随机的添加扰动，然后不断暴力尝试，测试是否攻击成功即可。

但是实际上，这样的搜索是及其耗时的，并且随着特征纬度增加，几乎是不可实现的，想要通过随机的干扰构造出对抗样本的可行性是很小的。

基于此，现在已有很多生成对抗样本相关的算法出现，下面仅做一些简单的介绍：

Fast Gradient Sign Method（FGSM）
这个算法在Good Fellow的论文EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES中提出，主要是基于对抗样本的线性解释。之前很多人认为是由于模型非线性的特征导致了对抗样本的产生，而论文提出恰恰是模型本身的线性（或者说是通过点乘得到score的方式）引发了对抗样本。一个形象的解释如下图：

Targeted FGSM
与FGSM主要的区别是，FGSM将样本沿着梯度下降的反方向构造样本，而targeted FGSM沿着希望模型误判的class的方向构造。

Iterative FGSM(I-FGSM)
上面两个FGSM的算法在构造对抗样本的时候都只进行了一部构造，也就是沿着特定的方向在一定阈值的限制下，移动一步。而I-FGSM则通过多步更小的移动，使得能够构造出更加精准的对抗样本，但同时也提升了构造的计算量，减慢了构造的速度。

RAND-FGSM
该算法在论文Ensemble Adversarial Training Attacks and Defenses中提出，提出的原因主要是认为：在数据点附近的损失函数会有很大的曲率，也就是不够平滑，从而导致生成的对抗样本会对自身的模型有特异性，这也解释了为什么经过对抗训练的模型对于白盒攻击的鲁棒性比黑盒攻击的鲁棒性更好这个奇怪的现象。

JSMA
算法提出自论文The Limitations of Deep Learning in Adversarial Settings

对抗训练
通过在原有的模型训练过程中注入对抗样本，从而提升模型对于微小扰动的鲁棒性。如FGSM的做法就是直接修改损失函数如下：

黑盒攻击和白盒攻击
很容易理解，黑盒攻击就是已知输入输出的对应关系，攻击者去寻找对抗样本来实现对模型的攻击。而白盒攻击就是已知模型的所有结构和知识，来实现对模型的攻击。在论文Practical Black-Box Attacks against Machine Learning中，提出对于模型的黑盒攻击可以通过观察其输入输出的对应关系，构造一个相似的机器学习模型，然后对其进行白盒攻击，得到的对抗样本通常也具有迁移性，能够对需要攻击的黑盒达到很高的成功率。

3.4 CmBN

BN是对当前mini-batch进行归一化，CBN是对当前以及当前往前数3个mini-batch的结果进行归一化，而CmBN则是仅仅在这个Batch中进行累积。
CmBN 是 CBN 的改进版，它仅收集单个批次内 mini-batch 之间的统计数据。

3.5 modified SAM

modified SAM中没有使用pooling，而是直接用一个卷积得到的特征图直接使用Sigmoid进行激活，然后对应点相乘，所以说改进后的模型是Point-wise Attention。

3.6 modified PAN

将 PAN 中的捷径连接替换为级联。

四、效果

作者对比了 YOLOv4 和当前最优目标检测器，发现 YOLOv4 在取得与 EfficientDet 同等性能的情况下，速度是 EfficientDet 的二倍！此外，与 YOLOv3 相比，新版本的 AP 和 FPS 分别提高了 10% 和 12%。
AP（average precision）：平均精度
AP50：50个以内的精度

参考：
1.目标检测算法-YOLO算法纵向对比理解
2.深入浅出Yolo系列之Yolov3&Yolov4核心基础知识完整讲解
3.目标检测回归损失函数简介：SmoothL1/IoU/GIoU/DIoU/CIoU Loss

常见机器学习算法与应用场景计算机软件程序设计知识科普机器学习算法人工智能
当然可以。下面是对常见机器学习算法的全面详细阐述，包括每种算法的基本原理、特点以及典型应用场景。1.监督学习（SupervisedLearning）1.1线性回归（LinearRegression）原理：通过拟合一条直线来表示输入和输出之间的关系，适用于预测连续值输出。特点：简单易懂，计算速度快，但只能捕捉线性关系。应用场景：房价预测股票价格预测销售额预测1.2逻辑回归（LogisticRegre
python安装apk到手机_Python3 UI 自动化通过线程解决安装 apk 时的权限弹窗 (一) 张云雷宝宝 python安装apk到手机
#-*-coding:utf-8-*-#@author:xiaoxiao#@date:2019/4/6importthreadingimportosimportuiautomator2asu2driver=u2.connect("882QADT9UWT")classusb_install_thread(threading.Thread):#安装确认def__init__(self):threadi
统信UOS_麒麟KYLINOS上安装特定版本python_统信uos安装python m0_60635001 程序员 python linux 开发语言
获取:17https://professional-packages.chinauos.com/desktop-professionaleagle/mainamd64libgpg-error-devamd641.35.3-1+dde[123kB]获取:18https://professional-packages.chinauos.com/desktop-professionaleagle/mai
自动化时候的坑：adb install时如何处理可恶的风险管控弹窗或者未知来源应用弹窗！ dialogtwb ui自动化多线程 adb python 软件测试
各位在自动化通过adbinstall或者pminstall的时候，有没有遇到过华为或者小米或者一加手机的各种安装弹窗呢，除了手动设置，该如何解决呢？目前自动化主流框架，pythonuiautomator2或者appuim等在执行测试的时候会自动给手机安装atx或者appuim引擎，但是如果不手动的点击允许，那么会导致测试失败，这种情况改如果处理呢？下面提供一种多线程的解决方案，亲测可行1个线程执行
通用 Makefile 模板想和我重名？小Tips 开发语言 linux
一个简单的Makefile模版#=============================================================================#示例项目结构:#my_project/#├──Makefile#├──src/#│├──main.c#│└──module1.cpp#└──include/#├──my_header.h#└──module1.h
2024年Python最新统信UOS_麒麟KYLINOS上安装特定版本python_统信uos安装python 2401_84558914 程序员 python linux 服务器
准备解压…/16-libidn2-dev_2.0.5.1-1+dde_amd64.deb…正在解压libidn2-dev:amd64(2.0.5.1-1+dde)…/var/cache/apt/archives/libidn2-dev_2.0.5.1-1+dde_amd64.deb正在选中未选择的软件包libp11-kit-dev:amd64。准备解压…/17-libp11-kit-dev_0.2
LeetCode 70：爬楼梯｜递归到动态规划全路径解析 kiki_2411 算法设计与分析 leetcode 动态规划算法
本篇博客将通过LeetCode第70题“ClimbingStairs”为例，系统讲解从递归暴力解法到记忆化搜索、再到动态规划及空间优化的四种典型思路，适合算法初学者深入掌握递归与DP基础。文章目录LeetCode70|爬楼梯一、题目描述二、思路分析三、方法一：递归（不带记忆）思路C++代码四、方法二：递归+记忆化搜索（Top-DownDP）思路五、方法三：动态规划（Bottom-Up）思路六、方法
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution论文阅读青铜锁00 #退化论文阅读深度学习论文阅读图像处理
LearningFullyConvolutionalNetworksforIterativeNon-blindDeconvolution1.研究目标与实际问题1.1研究目标1.2实际意义2.创新方法与模型设计2.1核心框架：迭代式梯度域处理2.1.1模型架构2.2关键技术实现2.2.1梯度域去噪网络2.2.2解卷积模块（核心公式实现）2.2.3损失函数设计2.2.4超参数端到端学习2.3与传统方法
HarmonyOS应用开发进阶：ArkTS高效开发模式与工程实践一键难忘 harmonyos HarmonyOS应用开发者
文章目录HarmonyOS应用开发进阶：ArkTS高效开发模式与工程实践一、高级组件开发模式1.1自定义组合式组件二、网络通信与数据缓存2.1智能请求管理三、动态交互与动画引擎3.1手势驱动动画四、模块化工程架构4.1分层架构设计4.2动态模块加载五、多设备适配策略5.1响应式布局系统六、性能监测与优化6.1渲染性能分析七、测试与质量保障7.1自动化测试框架八、持续集成与部署8.1自动化构建流程结
Android开发：管理设备配置更改与广播接收器
背景简介在Android开发中，确保应用在面对设备配置更改时数据不丢失，以及高效地管理网络请求，是提升用户体验的关键。本篇博客将基于《AndroidDeveloperFundamentalsCourse(V2)》课程内容，探讨如何使用AsyncTaskLoader来处理数据持久化问题，以及如何利用广播接收器来响应系统广播和自定义广播。使用AsyncTaskLoader进行数据持久化当用户旋转设备屏
TCP/UDP通信调试实战工具
本文还有配套的精品资源，点击获取简介：TCP调试助手是一款旨在协助程序员和网络管理员进行TCP和UDP协议调试的网络通信工具。TCP作为一种面向连接、可靠的协议，具有诸如连接管理、数据分片与重组、流量和拥塞控制等特点。该工具支持TCPServer和TCPClient两种模式，允许用户模拟服务器和客户端进行通信测试。同时，它也支持UDP通信模式，适合实时性要求高而数据完整性要求不高的场合。通过TCP
深入理解HashMap：从数据结构到高并发战场达利源 java面试题哈希算法散列表算法
以下是我在财税业务中的自我体会：一、核心矛盾与设计哲学想象一个存放千万级纳税人信息的仓库（Map）。你需要：极速存取：输入ID，瞬间定位到对象。动态扩容：纳税人数量激增时，仓库能自动变大。空间高效：避免仓库大部分区域空置。线程安全(可选)：多窗口（线程）同时办理业务不混乱。HashMap的答卷：核心武器：数组+链表/红黑树灵魂算法：哈希函数(HashFunction)扩容策略：负载因子(LoadF
[由浅入深理解神经网络] 2 张量流与反向传播
由浅入深理解神经网络2张量流与反向传播0前言1张量流和运算图2复合函数视角2.1复合函数求导2.1.1链式法则2.1.2多元函数的链式法则2.2前馈网络的反向传播2.3任意网络的反向传播3结语0前言在由浅入深理解神经网络1一个简单到极致的神经网络中,我们已经发现了训练神经网络最重要的一件事,那就是求梯度,然后优化算法利用梯度来调整网络参数.我们重写一下前面提到的一个通用的神经网络:y=f(x;θ)
中国计算机学会（CCF）推荐学术会议-C（网络与信息安全）：TrustCom 2025 爱思德学术网络安全信息与通信
TrustCom2025TheIEEETrustCom-2025(24thIEEEInternationalConferenceonTrust,SecurityandPrivacyinComputingandCommunications)isaforumforpresentingleadingworksontrustedcomputing,communications,networkingandm
Python 安装使用 tesseract OCR 识别中文花果山总钻风 Python/Flask Linux python ocr 开发语言
前言：i、中文识别效果更好的开源OCR库：CnOCR使用教程ii、6款开源中文OCR使用介绍（亲测效果）：点我查看iii、windows安装tesserract教程：windows安装：点我查看教程1、点我查看教程2windows安装完成，设置好环境变量后，报找不到路径的错误点这里：解决办法本文为CentOS下安装教程Tesseract的OCR引擎目前已作为开源项目发布在GoogleProject
rabbitmq动态创建交换机、队列、动态绑定，销毁
//缓存已创建的绑定，避免重复声明privatefinalMapcreatedBindings=newConcurrentHashMapargs=newHashMap{@AutowiredRabbitMQServicerabbitMQService;@OverridepublicvoidonApplicationEvent(ListenerContainerConsumerFailedEvente
【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？努力毕业的小土博^_^ 机器学习基础算法优质笔记2 深度学习学习笔记迁移学习人工智能机器学习
【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？文章目录【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？✅一、使用正则化进行模型压缩（ModelCompression）目标：方法：L1正则化促使权重稀疏化代码示例：后续压缩步骤
人类编程时代即将终结？OpenAI首席产品官预测AI将在今年底全面超越人类程序员前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读近日，OpenAI首席产品官KevinWeil在接受采访时表示，人工智能的发展速度远超预期，今年底就有可能在编程领域永久性地超越人类程序员。这一观点立即引发了行业热议，也让程序员们对未来产生了深刻的思考。人工智能的进展速度远超想象在与VarunMayya和TanmayBhat共同主持的YouTube节目《O
Python中Tesseract OCR的中文识别包实操指南
本文还有配套的精品资源，点击获取简介：TesseractOCR是一个开源的光学字符识别引擎，支持多语言包括中文识别。介绍如何在Python中使用pytesseract库进行图像文字识别，并详细说明安装TesseractOCR以及其中文语言包的步骤。提供了一个Python示例代码来展示图像识别的流程，并解释如何通过预处理提高识别准确率。此外，概述了TesseractOCR的高级功能和训练自定义模型的
一封邮件读懂准确率、精准率、召回率、F1 Score fairymt 产品经理的AI秘籍 AIGC 人工智能 AI作画 chatgpt ai
文章目录场景设定核心目标定义样本类别模拟评估结果四大核心指标详解①准确率（Accuracy）②精准率（Precision）③召回率（Recall）④F1Score如何选对指标？总结场景设定场景：公司开发了一个AI邮箱垃圾邮件（Spam）过滤器。我要评估这款AI垃圾邮件过滤器，判断它是否“合格”。核心目标核心目标：我们希望它能尽可能识别出所有垃圾邮件（别放过坏人）；尽量不误伤正常邮件（不冤枉好人）。
python rest framework_Python Django rest framework
本节内容Djangorestframework安装Djangorestframwwork环境配置简单举例说明Django中使用restframework1.1安装Djangorestframework建立新的环境可以忽略virtualenvenvsourceenv/bin/activate安装djangorestframework模块pipinstalldjangopipinstalldjango
Python大数据分析&人工智能教程 - Django-Celery异步处理（深入解析与实战案例） AI_DL_CODE python 数据分析 Django Celery异步处理 Celery
文章目录1.概念介绍1.1Django框架概述1.2Celery异步任务队列1.3AMQP协议与消息路由2.环境搭建2.1安装Django和Celery2.2配置Redis作为消息代理3.Celery架构与工作原理3.1Celery组件介绍3.2任务生命周期3.3任务调度与执行3.3.1定时任务3.3.2异步任务调用3.3.3任务结果查询4.Django与Celery集成4.1创建Celery实例
Python使用连接池操作MySQL 菜鸟驿站2020 python python mysql
测试环境说明：Python版本是3.8.10，DBUtils版本是3.1.0，pymysql版本是1.0.3首先安装指定版本的连接池库DBUtils、还有pymysqlpipinstallDBUtils==3.1.0pipinstallpymysql==1.0.3创建文件sqlConfig.py#sqlConfig.pyimportpymysqlfromdbutils.pooled_dbimpor
python序列化工具_python_restframework(序列化) weixin_39623271 python序列化工具
django自带的序列化工具serializers三步骤导入fromdjango.coreimportserializers生成对象并传参response=serializers.serialize('json',book_list)第一个json是解析器，说明要解析成json格式的字符串,第二个是queryset对象,最后返回结果returnJsonResponse(response,safe=
Java高并发系统限流算法的应用赵广陆 arithmetic java 算法开发语言
目录1概述2计数器限流2.1概述2.2实现2.3结果分析2.4优缺点2.5应用3漏桶算法3.1概述3.2实现3.3结果分析3.4优缺点4令牌桶算法4.1概述4.2实现4.3结果分析4.4应用5滑动窗口5.1概述5.2实现5.3结果分析5.4应用想学习架构师构建流程请跳转：Java架构师系统架构设计1概述在开发高并发系统时有三把利器用来保护系统：缓存、降级和限流。限流可以认为服务降级的一种，限流是对
免安装一键修复网络诊断 + 权限修复！打印机共享错误工具适配 Win7/10/11 文哥工具箱2 电脑软件工程开源软件
各位打印小能手们！你们有没有遇到过共享打印机出问题，搞得自己焦头烂额的情况？比如系统一更新，打印机就连不上，打印任务失败，真的是让人崩溃啊！别慌，今天就给大家全面介绍一款打印机共享错误修复工具，开发者声明：软件没签名，报毒在正常不过了，如果介意，删除即可。软件下载地址安装包这工具就是专门解决局域网里共享打印机各种故障的实用软件。系统更新、权限设置、驱动不兼容或者网络配置这些问题，都会让共享打印机无
LoRA 实战指南：NLP 与 CV 场景的高效微调方法全解析 fairymt 产品经理的AI秘籍自然语言处理人工智能机器学习
大模型已成AI应用的“标配”，但高昂的训练和部署成本让很多企业望而却步。LoRA（Low-RankAdaptation）作为一种轻量级微调方案，正成为NLP与CV场景中低成本定制的利器。本文详细通过详细介绍LoRA的核心原理、在文本与图像任务中的应用场景、主流工具框架与实践方式，帮助你快速掌握这项高性价比技术。国产生态实战：基于LLaMA-Factory+DeepSeek+LoRA+FastAPI
Python大数据分析&人工智能教程 - Django-RestFramework框架（深入解析+实操案例） AI_DL_CODE python 数据分析 django RestFramework框架
文章目录1.Django-RestFramework基础1.1Django-RestFramework概述1.2安装与配置1.3构建第一个API1.3.1定义模型1.3.2创建序列化器1.3.3定义视图1.3.4配置URL路由1.4进阶功能1.4.1权限控制1.4.2限流1.5实战案例1.5.1创建图书1.5.2查询图书1.5.3更新图书1.5.4删除图书2.序列化器(Serializers)2.
Golang中的数组 white.tie Golang golang 开发语言后端
GolangArray和以往认知的数组有很大不同。有点像Python中的列表1.数组：是同一种数据类型的固定长度的序列。2.数组定义：vara[len]int，比如：vara[5]int，数组长度必须是常量，且是类型的组成部分。一旦定义，长度不能变。3.长度是数组类型的一部分，因此，vara[5]int和vara[10]int是不同的类型。4.数组可以通过下标进行访问，下标是从0开始，最后一个元素
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring