zjuPeco

Yolo系列知识点梳理（Yolov1-v5）

文章目录

1 概述
2 Yolo系列模型
- 2.1 基石 - Yolov1
- - 2.1.1 Yolov1的网络结构
  - 2.1.2 Yolov1的feature map
  - 2.1.3 Yolov1的训练
  - 2.1.4 Yolov1的预测
  - 2.1.5 Yolov1小结
- 2.2 Yolo9000 - Yolov2
- - 2.2.1 Better
  - - 2.2.1.1 引入了Batch normalization
    - 2.2.1.2 高分辨率的分类器
    - 2.2.1.3 加入了anchor机制
    - 2.2.1.4 loss的改动
    - 2.2.1.5 Fine-Grained Features
    - 2.2.1.6 多尺度训练
  - 2.2.2 Faster
  - 2.2.3 Stronger
- 2.3 一小步 - Yolov3
- 2.4 技巧 - Yolov4
- - 2.4.1 网络结构的改进
  - - 2.4.1.1 backbone中的激活函数改为Mish
    - 2.4.1.2 backbone中的残差模块改成了CSP
    - 2.4.1.3 detector中的新增了SPP模块
    - 2.4.1.4 detector中特征尺度的变化
  - 2.4.2 损失函数的改进
  - 2.4.3 nms的改进
  - 2.4.4 其他
- 2.5 又一小步 - Yolov5
- - 2.5.1 网络结构的改进
  - 2.5.1.1 添加了CSP2模块
  - 2.5.2 其他
3 结束语
参考资料

1 概述

Yolo系列的模型是大多数做目标检测的图像算法工程师都在使用的，使用时经常也是先用了看看效果再说，如果效果不错，有时间再回头来研究一下模型，有时甚至就忘了回过头来细究。这篇文章就是一个回头的产物。

Yolo的每一个系列都令人惊艳，本文综合了原始论文和网上各家的一些说法，把Yolo每个系列究竟产出了一些什么做一个系统的梳理，也方便我以后的再回头。

如果Yolo之后有人继续更新下去，本文也会尽量做到继续更新。

文中的图片都出自参考资料，非本人原创。

2 Yolo系列模型

2.1 基石 - Yolov1

Yolov1是目标检测中one-stage方法的开山之作，它不同于two-stage需要先过一个RPN网络得到候选区域的方法，yolo直接在整张图的feature map上进行目标的定位和分类，因此速度也比当时正红的Fast R-CNN快很多。而且，也正是因为yolo看的是全局的信息，yolo把背景误判成目标的错误率比只看proposals的Fast R-CNN低很多。不过整体的准确率，还是Fast R-CNN高。

2.1.1 Yolov1的网络结构

Yolov1的网络结构如下图所示，并不复杂，输入是 $448\times448\times3$ 的图片，输出是一个 $7\times7\times30$ 的feature map。网络中共有24个全卷积和尾部的2个全连接，其中用到了大量的 $1\times1$ 卷积用来改变通道数，当然也有融合通道之间特征的作用。这里最后用的两层全连接其实今天看来有点不解，后面的版本就没有用了。这个网络结构就是大名鼎鼎的Darknet。

图1 Yolov1网络结构示意图

网络的卷积层在ImageNet上用分类任务进行了预训练，使得卷积层可以抽到比较好的图像特征，但是预训练时的输入图像为 $224\times224$ 的，这其实会有点问题，在训练检测模型时，输入为 $448\times448$ ，模型需要去适应这种分辨率的转换，对结果是有影响的，这个在之后的版本会优化。

2.1.2 Yolov1的feature map

我们再来看下Yolov1输出的 $7\times7\times30$ 的feature map，其中 $7\times7$ 是经过层层全卷积和全连接之后下采样得到的结果，每个grid对应着原图上相应位置的一块区域，可以理解为将 $448\times448$ 的输入长宽都等分为了7份，共有49个grids。

每个grid都对应了一个长度为30的向量，准确来说应该是一个 $2\times5+20$ 的向量，其中2表示2个预测框；5表示每个预测框的 $x_{center}, y_{center}, w, h, confidence]$ ， $c o n f i d e n c e$ 指的是这个预测框内目标的置信度 $\times IOU_{pred}^{truth}$ ，当没有物体时， $P r (O b j e c t) = 0$ ， $c o n f i d e n c e = 0$ ，当有物体时， $confidence=IOU_{pred}^{truth}$ ；20表示20种目标类别的置信度，表示为 $Pr(Class_i|Object)$ 。

在预测时，最终某个框内表示了某个目标的置信度为 $confidence \times Pr(Class_i|Object)$ 。

图2 Yolov1的feature map示意图

写一个一目了然版的就是某个grid的30维向量为
$x_{c1}, y_{c1}, w_1, h_1, confidence_1, x_{c2}, y_{c2}, w_2, h_2, confidence_2, cate_1, ..., cate_{20}]$

如果要知道某个grid第一个框表示 $cate_1$ 这个目标的概率，则为 $confidence_1 \times cate_1$ 。

仔细一想，会发现每个grid只能表示一个物体， $confidence_i$ 代表了有没有物体和用哪个预测框， $cate_i$ 表示了这个物体是哪个目标类别。也就是 $7\times7$ 的feature map最多只能预测出49个目标，这对小目标和相邻多目标很不友好。

2.1.3 Yolov1的训练

训练部分只讲和loss相关的内容，其他的和Yolo本身关系不大，都是标准的pipeline。

训练时，我们的label是每张图片多个检测框坐标和对应的物体类别。每个物体都会落在 $7\times7$ 的feature map中的某一个格子里，落到哪个格子里，那么那个格子里就负责预测这个物体。而每个格子又有两个框，就取其中和真实物体的bbox的iou较大的那个预测框作为负责这个物体的预测框。这里负责的意思就是算loss的时候拿负责的框去算loss。

loss共由五个部分组成：
（1）中心定位误差

就是负责这个物体的检测框的中心点坐标和这个物体真实的中心点坐标差多少。

$L_1 = \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{I}_{ij}^{obj} ((x_i - \hat{x}_i)^2 + (y_i - \hat{y}_i)^2)\tag{2-1}$

其中， $S^2$ 表示 $7\times7$ 的feature map的格子的集合； $B$ 表示每个格子中bbox的集合； $\mathbb{I}_{ij}^{obj}$ 是一个指示函数，表示第 $i$ 个格子的第 $j$ 个框负责预测真实物体时进行后面的计算，否则为0； $x_i$ 和 $y_i$ 是ground truth的中心点坐标； $\hat{x}_i$ 和 $\hat{y}_i$ 是负责这个物体的预测框的中心坐标。

（2）宽高误差

就是负责这个物体的检测框的宽高和这个物体真实的宽高差多少。

$L_2 = \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{I}_{ij}^{obj} ((\sqrt{w_i} - \sqrt{\hat{w}_i})^2 + (\sqrt{h_i} - \sqrt{\hat{h}_i})^2)\tag{2-2}$

其中， $w_i$ 和 $h_i$ 是ground truth的宽高； $\hat{w}_i$ 和 $\hat{h}_i$ 是负责这个物体的预测框的宽高。其他符号和 $L_1$ 中相同。

（3）正样本confidence误差

保证负责物体的预测框的confidence接近1。

$L_3 = \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{I}_{ij}^{obj} (C_i - \hat{C}_i)^2\tag{2-3}$

其中， $C_i$ 表示这个格子内有物体中心的标签， $\hat{C}_i$ 表示这个格子内有物体中心的置信度。

（4）负样本confidence误差

保证不负责物体的预测框的confidence接近0。

$L_4 = \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{I}_{ij}^{noobj} (C_i - \hat{C}_i)^2\tag{2-4}$

其中， $\mathbb{I}_{ij}^{noobj}$ 是一个指示函数，表示第 $i$ 个格子的第 $j$ 个框不负责预测真实物体时进行后面的计算，否则为0。

（5）类别误差

表示负责预测的格子内的类别误差。

$L_5 = \sum_{i=0}^{S^2} \mathbb{I}_{i}^{obj} \sum_{c \in classes}(p_i(c) - \hat{p}_i(c))^2\tag{2-5}$

其中， $\mathbb{I}_{i}^{obj}$ 是一个指示函数，表示第 $i$ 个格子的负责预测真实物体时进行后面的计算，否则为0； $p_i(c)$ 表示第 $i$ 个格子第 $c$ 个类别的标签； $\hat{p}_i(c)$ 表示第 $i$ 个格子第 $c$ 个类别的置信度。

综合， $(2 - 1) - (2 - 5)$ 就有

$\lambda_{coord}L_1 + \lambda_{coord}L_2 + L_3 + \lambda_{noobj}L_4 + L_5 \tag{2-6}$

其中， $\lambda_{coord}$ 和 $\lambda_{noobj}$ 是可以用来调整的超参数，也就是各个loss的权重。不难看出Yolov1把目标检测看成了一个回归问题。

2.1.4 Yolov1的预测

预测部分没啥说的，就是对得到的98个预测框进行一个阈值的筛选之后，再做nms。

2.1.5 Yolov1小结

优点：
（1）速度快
（2）考虑图片的全局特征，precision较高

缺点：
（1）每个格子只能预测一个物体，对密集型的物体检测不友好
（2）下采样次数多，最终所使用的特征比较粗糙

2.2 Yolo9000 - Yolov2

Yolov2在Yolov1的基础上有很大的改动，这一节就针对改进部分依次说明。

2.2.1 Better

2.2.1.1 引入了Batch normalization

BN是一个非常有用的模块，其有点如下：

加快收敛
改善梯度，远离饱和区
允许大的学习率
对初始化不敏感
相当于正则化，使得有BN层的输入都有相近的分布

有了BN之后，就可以不用dropout了，或者说不能像原来一样用dropout了，这会导致训练和测试的方差偏移，可以参看文献[5]。

2.2.1.2 高分辨率的分类器

Yolov1当中对backbone做预训练的时候，用的是 $224\times224$ 的输入，而yolov1为了高分辨率用的是 $448\times448$ 的输入，这样就导致了模型要去适应这个分辨率的转换。于是，Yolov2干脆直接用 $448\times448$ 的输入预训练backbone了。这样带来了几乎4%mAP的提升。这种简单而高效且不用增加预测负担的方法是我们最喜欢的。

2.2.1.3 加入了anchor机制

在Yolov1中没有anchor的概念，所以 $7\times7$ 的feature map中预测的两个预测框都是野蛮生长的，这两个预测框很有可能就长的差不多，而且这样去学习不同形状的物体，对模型来说是比较困难的。

所以，Yolov2删去了最后的全连接层，引入了anchor机制。Yolov2的输入变成了 $416 \times 416$ ，feature map大小为 $13\times13$ ，每个格子有5个anchors，每个anchor的长宽大小和比例不同，各司其职，负责不同形状的物体。有了anchor之后，模型就不需要直接去预测物体框的长宽了，只需要预测偏移量就可以了，这相对来说降低了难度。

这里提一句，之所以从 $448 \times 448$ 变成 $416 \times 416$ 就是为的使得feature map的size是一个奇数。这样的好处是，许多图片的中心点都是某个物体的中心，奇数保证中间是一个格子，而不是偶数那样四个格子抢占中心点。

图3 Yolov2的anchor形状示意图

不过引入anchor也有不好的地方，本来不用anchor的时候，预测出来只有98个框，现在有845个框了，从最终结果来看，precision略有下降了，不过recall变高了许多。

图4 Yolov2的anchor输出示意图

Yolov1的输出是一个 $\times 7 \times 30$ 的，Yolov2的输出是一个 $13 \times 13 \times 125$ ，其中 $\times 5$ 。括号里的 $5$ 表示 $x_i,y_i,w_i,h_i,conf_i$ , $20$ 表示每个类别的概率，共20个类别，最后的 $5$ 表示 $5$ 个预测框。图4表示的非常清楚了。

可以看出，同一个格子里的每个预测框的类别是可以不同的，一个格子可以预测5个物体了。

图5 Yolov2的anchor聚类示意图

那么这5个anchor的预锚框是怎么确定的呢？甚至为什么是5个呢？根据论文中所述，anchor的形状是在VOC 2007和COCO数据集上聚类得到的，聚类的类别个数从1到15都试过，最终在效果和性能的权衡之下选择了5个类聚出来的锚框形状，示意图如上图5所示。

图6 Yolov2的anchor编码示意图

说了半天，模型究竟是怎么计算offset的呢？如上图6所示，yolov2的anchor编码在二阶段的检测模型的基础上做了改进。图6中 $c_x$ 和 $c_y$ 是每个格子的左上角坐标， $t_x$ 和 $t_y$ 是模型预测锚框中心点坐标时的输出参数，加了 $\sigma$ 就把中心点的偏移量限定在了这个格子里，这样不管模型怎么预测，中心点都飞不出这个格子。 $p_w$ 和 $p_h$ 是预锚框的初始宽高， $t_w$ 和 $t_h$ 是模型预测锚框宽高的输出参数，这里就没有限制最终锚框的形状。 $b_x$ ， $b_y$ ， $b_w$ ， $b_h$ 是最终的预测框的中心点坐标和宽高。我把图中的公式抄一份下来就是 $(2 - 7)$ 。

$\begin{aligned} b_x &= \sigma (t_x) + c_x \\ b_y &= \sigma (t_y) + c_y \\ b_w &= p_w e^{t_w} \\ b_h &= p_h e^{t_h} \\ \end{aligned} \tag{2-7}$

除此之外，还有一个东西叫做 $t_o$ ， $t_o$ 是用来给出有物体的置信度的。

$P_r(object)IOU(b, object) = \sigma(t_o) \tag{2-8}$

2.2.1.4 loss的改动

Yolov2的loss我直接拿子豪兄做的图了，这个也是网友们根据源码整理出来的，论文中并没有说这件事。

图7 Yolov2的loss示意图

前面的三个求和就是指的下面的所有操作都是对每个格子每个预测框分别做的； $\mathbb{I}_{MaxIOUIMaxIOU<Thresh$

2.2.1.5 Fine-Grained Features

增加了细粒度的特征，方法就是把浅层的 $26 \times 26 \times 512$ 这层的输出分成四份之后concat到原来的特征上。 $26 \times 26 \times 512$ 分成四份并concat就变成了 $13 \times 13 \times 2048$ ，这个和 $13 \times 13 \times 1024$ 的特征concat到一起变成了 $13 \times 13 \times 3072$ 。

图8 Yolov2的pass through示意图

四分的方式有点空洞卷积的意思，如下图9所示。

图9 Yolov2的pass through切分方式示意图

2.2.1.6 多尺度训练

Yolov2每10个batches就会换一下输入的尺度，使得模型泛化于不同尺度的输入，这得益于adaptive pooling层。高分辨率的输入速度慢，但是对小目标的检测效果要好很多，低分辨率的输入速度快。

图10 Yolov2的多尺度训练示意图

2.2.2 Faster

这部分没啥说的，就是把backbone给换成了Darknet-19，都是卷积层和pooling层，更加轻量了。

2.2.3 Stronger

这部分是作者对超多分类的一次尝试，但估计效果没有那么好，只是一个设想。

用来训练检测模型的数据集coco有80个类别，10万的图片，但用来分类的数据集imagenet有22k个类别，140万的数据。作者想要把imagenet的数据和类别拿来用，于是就相处了层级分类这个办法，如下图11所示。

图11 Yolov2的层级分类示意图

imagenet中的每个类别并不是完全两两互斥的，它们之间是有层级关系的，所以作者借助wordnet把类别进行了分层，同一层的类别分别进行softmax，这样就做到了多层级的分类。检测模型的类别都是包含在这些类别之中的，再将其应用到检测模型即可。

这只是一个设想，了解一下即可。

2.3 一小步 - Yolov3

Yolov3相对于Yolov2没有太多大的改进，用作者的话说就是"I managed to make some improvements to YOLO. But, honestly, nothing like super interesting, just a bunch of small changes that make it better."

作者对backbone的网络结构进行了改进，将Darknet19结合Resnet，变成了Darknet53。作者把残差块轻量化了一下，如下图12所示。

图12 Yolov3的残差块轻量化示意图

除此之外，还增加了多尺度训练机制，增加了多尺度训练的网络结构示意图如下图13所示。输出三个尺寸的feature map，分别是 $13 \times 13$ ， $26 \times 26$ 和 $52 \times 52$ 。大尺寸的feature map是小尺寸的feature map上采样并结合浅层特征得到的。

图13 Yolov3的网络结构示意图

每个尺寸的feature map各司其职， $13 \times 13$ 负责大目标物体， $26 \times 26$ 负责中目标物体和 $52 \times 52$ 负责小目标物体。原因很简单，越深层的信息越抽象，越浅层的越粗糙，浅层还保留着小物体的信息，深层就不一定还在了。

从图13中可以看到feautre map的输出channel变成了256，这个是因为Yolov3的anchor变成了9个，每个尺度的feature map有3个，然后类别变成了80类，所以每个尺度的feature map有 $\times (4+1+80)$ 。

图14 Yolov3的多尺度示意图

Yolov3就这些重要的改进。

2.4 技巧 - Yolov4

Yolov4可以说是目标检测各种小技巧的大总结，它将技巧分为了bag of freebies(BoF)和bag of specials(BoS)两种，BoF指的是只增加训练的成本而不增加推理的成本的技巧，通常是前后处理；BoS指的是只增加一点推理成本却可以显著提高模型效果的技巧，通常是结构上的变化。

不同的BoF和BoS面对不同的问题和数据集有不同的效果，根据需求选择即可。

BoF和BoS都有一大堆，要在这里全讲完太费时间，也与这篇文章的目的相悖。这里只讲一些重要的，且最终的Yolov4用上的技巧。下图15是Yolov4真正用到的一些改进。

图15 Yolov5的技巧选择示意图

这里不会把上面的所有改进都讲了，只挑一些重要的讲。

2.4.1 网络结构的改进

2.4.1.1 backbone中的激活函数改为Mish

Yolov3中的卷积快都是CBL的结构，Yolov4改成了CBM，也就是把激活函数给改成了Mish，其示意图如下图16所示。

图16 CBL变为CBM示意图

Leaky Relu激活函数是（ $a$ 是很小的常数）

$\begin{cases} ax, &if \ x<0 \\ x, &otherwise \end{cases} \tag{2-9}$

Mish激活函数就是

$\cdot tanh(log(1+e^x)) \tag{2-10}$

这里顺便来说说常用的激活函数的优缺点。

sigmoid两端很容易饱和，会造成梯度消失的问题，中间梯度很大，会造成梯度爆炸问题。用sigmoid做激活函数，神经网络不太好训练。但是sigmoid的非线性表达能力很强，因为它不管怎么高阶求导仍旧是非线性的。

tanh和sigmoid很像，不过它是以0为中心。

relu的问题是，它的负半轴没梯度了，正半轴求个导是常数，非线性表达能力很弱。但是它快。所以用relu的网络一般网络层数很深，以此来弥补relu非线性能力表达弱的缺陷。

leaky relu负半轴做了优化，但还是非线性表达能力弱。

mish结合了relu和tanh的优点。它无上限，这样可以保证没有饱和区域，不会梯度消失。有下限，能够保证具有一定的正则能力。同时非线性表达能力也不错。

2.4.1.2 backbone中的残差模块改成了CSP

Yolov3中的残差模块如下图17所示，resX中的X表示的是有X个Res unit。

图17 Yolov3残差模块示意图

Yolov4则是将残差模块替换为了CSP模块，如下图18所示，其中的CSPX中的X表示有X个Res unit。

图18 Yolov4残差模块示意图

可以看出CSPX效仿残差块，额外加了一路，并且这一路中多了一个CBM，最后的add也变成了concat。相当于一堆残差的外面再残差了一遍。这里加个CBM直观上是为了改变特征的shape，使其可以顺利concat。除此之外，资料[8]中的猜想是，这是为了平衡上下两路的信息，相当于加了个电阻。每个这个电阻，就是个短路的状态，信息都从下面走了，有了这个电阻，就可以尽可能平衡上下路的信息。这只是个猜想。

2.4.1.3 detector中的新增了SPP模块

SPP的作用是增大感受野。它很简单，就是一堆MaxPooling，每个MaxPooling的kernel size大小不同，就有不同感受野的结果，最后再全都concat起来即可，其示意图如下图19所示。

图19 Yolov4的SPP示意图

SPP之所以不放在backbone是因为这会造成大量的信息丢失，而放在detector里却起到了降维的作用。

2.4.1.4 detector中特征尺度的变化

Yolov4还读detector中的尺度特征做了很大的修改，如下图20和图21分别是yolov3和yolov4的网络结构图。

图20 Yolov3网络结构图

图21 Yolov4网络结构图

不难看出Yolov3是 $19 \times 19$ -> $38 \times 38$ -> $76 \times 76$ 的，而Yolov4是反过来的，这主要是为了增加特征融合性，也就是feature map中融合了更多层的信息。特别是 $19 \times 19$ 这个feature map，融合的特征最多了，也就是对大目标的检测效果更好了。应该说不管大小目标，总体都有提升。

2.4.2 损失函数的改进

（1）变为smoth_L1
之前Yolo的损失函数当中有大量的L2损失，在Yolov4中改成了smooth L1。smooth L1结合了L1和L2损失的优点。先来看下L1和L2损失的公式

$\frac{1}{n} \sum_{i=1}^{n} |f(x_i - y_i)| \\ L2 = \frac{1}{n} \sum_{i=1}^{n} (f(x_i) - y_i)^2 \tag{2-11}$

L1的优点是倒数很稳定，但是是一个阶段函数，在 $(0, 0)$ 处是一个折线。L2的优点是在 $(0, 0)$ 处是可导的，但是离 $(0, 0)$ 越远，导数越大，会产生爆炸。所以就有了结合L1和L2的smooth L1出现

$smooth\ L1 = \begin{cases} 0.5x^2 & if\ |x| < 1 \\ |x| - 0.5 & otherwise \end{cases}\tag{2-12}$

（2）iou loss改进
这里主要参考了文献[10]

在Yolov3中的IOU loss就直接是 $1-IOU)^2$ 。这里的iou就是交集比上并集，如下图22所示。

图22 iou示意图

这里的IOU的计算方法优点缺点，且看下图23。缺点一就是左图所示，当预测框与真实框完全没有交叠时，不管预测框离真实框多远，IOU都是一样的，但其实离真实框近的比离真实框远的要好一些。缺点二就是中图和右图所示，当交集和并集一致时，不同方向的预测框得到的iou是一样的，但其实右图比中图要好一点，因为中图的中心点对齐需要预测框的水平和垂直都发生比较大的变化，而右图只需要水平平移即可。

图23 IOU缺点

为了解决上述的两个缺点，有了GIOU，如图24所示。

图24 GIOU示意图

GIOU的公式为

$\tag{2-13}$

最小外接矩形和差集的意思就是图24中的左图和中图，不难看初，刚才提到的两个缺点在这里已经解决了。不过还有一个问题，如图25所示。

图25 GIOU缺点

当预测框在真实框内部的时候，不管预测框在那个位置，GIOU都是一样的，但是图25的中图显然是优于左图和右图的，因为中图的水平和垂直方向的坐标已经对齐了，只需要改变长宽即可。

这个时候，就又出现了一种DIOU，如图26所示。

图26 DIOU示意图

DIOU的公式为

$(Distance\_2) / (Distance\_C) \tag{2-14}$

其中， $Distance\_C$ 是最小外接矩形的对角线距离， $Distance\_2$ 是预测框和真实框中心点的欧氏距离。

这样一来就解决了图25的缺点。但是，别急，还有一个缺点。DIOU没有考虑长宽比。

图27 DIOU缺点

图27中当预测中心点距离真实中心点一样时，预测框的长宽比与真实框接近的，显然是更优的。于是，就有了终极版的CIOU。

CIOU的公式为

$\frac{Distance\_2^2}{Distance\_C^2} - \frac{v^2}{1 - IOU + v} \tag{2-15}$

其中， $v$ 是长宽比的一致性参数，定义为

$\frac{4}{\pi}(arctan\frac{w_{gt}}{h_{gt}} - arctan\frac{w_{pred}}{h_{pred}})^2 \tag{2-16}$

至此，iou经历了这么多版本，最终确定为CIOU。

2.4.3 nms的改进

在训练的时候用的是CIOU，但是在做nms的时候，用了diou-nms。用diou-nms可以把一些重叠度很高的框，但表示不同物体的给保留下来。至于为什么不用CIOU，我觉得是没有必要，且会增加计算复杂度。我不太同意文献[10]中说的CIOU在做nms时没有真实框， $v$ 没法计算的说法，两个框做对比，把置信度高的当成真实框即可。

2.4.4 其他

其他比较重要的可能就是cutout，mosaic之类的数据增强的方法了，这个这里就不细讲了。

2.5 又一小步 - Yolov5

Yolov5和Yolov4差不多可以说没有做太多的改进，不过工程上更友好了一些，使用起来也更加方便。

2.5.1 网络结构的改进

2.5.1.1 添加了CSP2模块

下图28时Yolov5的网络结构图，和Yolov4几乎时一摸一样，做了一点点改进。

（1）把CBM换回了CBL，可能是为了提升速度。
（2）设计了CSP2模块，如图28的左下角所示，就是把之前CSP中的残差块改成了CBL。
（3）添加了Focus模块。这个其实就是Yolov2中的pass through。

图28 Yolov5网络结构图

2.5.2 其他

还有就是一些零零碎碎的东西，这里简单列几个比较有用的吧。

（1）添加了训练前自动计算最佳预锚框的模块。
（2）自适应图片缩放，就是padding的时候，去掉一些没用的黑边。

3 结束语

这里根据网上各家的资料总结了很多，其中也有一些自己的理解，对我自身了解Yolo有很大的帮助，也希望给看到这篇博客的人有一些帮助。

参考资料

[1] You Only Look Once: Unified, Real-Time Object Detection
[2] 【子豪兄】YOLOV1目标检测，看我就够了
[3] YOLO9000: Better, Faster, Stronger
[4] 【精读AI论文】YOLO V2目标检测算法
[5] Understanding the Disharmony between Dropout and Batch Normalization by Variance Shift
[6] YOLOv3: An Incremental Improvement
[7] YOLO系列算法之YOLOv3算法精讲
[8] 2021最新人工智能深度学习YOLOv4与YOLOv5教程
[9] YOLOv4: Optimal Speed and Accuracy of Object Detection
[10] 深入浅出Yolo系列之Yolov3&Yolov4&Yolov5&Yolox核心基础知识完整讲解
[11] 深入浅出Yolo系列之Yolov5核心基础知识完整讲解

你可能感兴趣的:(机器学习,目标检测,人工智能,计算机视觉,Yolo,知识梳理)

从点云中剔除遮挡点 AuSwift 点云
在三维计算机视觉和点云处理中，点云是由大量的三维点组成的数据集。然而，有时候点云中的某些点可能会被其他物体所遮挡，这可能会对进一步的分析和处理造成困扰。本文将介绍如何使用MATLAB从点云中移除这些遮挡点。在开始之前，请确保你已经安装了MATLAB和PointCloudProcessingToolbox。接下来，我们将按照以下步骤进行操作。步骤1：加载点云数据首先，我们需要加载点云数据。假设我们的
离线免费最新超长AI视频模型！一句话即可生成120秒视频，免费开源！只需要一张照片和音频，即可生成会说话唱歌的AI视频！能自行完成整个软件项目的AI工具，以及 Llama 3 在线体验和本地安装部署代码讲故事机器人智慧之心人工智能音视频开源 sora 视频 llama 离线
离线免费最新超长AI视频模型！一句话即可生成120秒视频，免费开源！只需要一张照片和音频，即可生成会说话唱歌的AI视频！能自行完成整个软件项目的AI工具，以及Llama3在线体验和本地安装部署。StreamingT2V（StreamingText-to-Video）模型是一种将文本描述转换为视频内容的人工智能技术。这种模型能够根据文本输入生成视频，通常用于自动视频生成、虚拟现实、增强现实、游戏开发
智能化植物病害检测：使用深度学习与图像识别技术的应用机器懒得学习深度学习人工智能
植物病害一直是农业生产中亟待解决的问题，它不仅会影响作物的产量和质量，还可能威胁到生态环境的稳定。随着人工智能（AI）技术的快速发展，尤其是深度学习和图像识别技术的应用，智能化植物病害检测已经成为一种趋势，能够大幅提高病害检测的效率与准确性。本文将介绍如何使用深度学习和图像识别技术，通过Python编写的智能化病害检测程序，实现对植物叶片病害的自动识别与分类。1.项目背景与目标在农业领域，及时发现
【cs.CV】25.1.14 arxiv更新速递 hinmer CV每日更新 arxiv chatgpt gpt 人工智能自然语言处理自动驾驶计算机视觉 ai
【cs.CV】25.1.14arxiv更新110篇—第1篇----=====Omni-RGPT:UnifyingImageandVideoRegion-levelUnderstandingviaTokenMarks关键词:计算机视觉,多模态大语言模型,区域级理解,TokenMark,视频理解链接1摘要:我们提出了Omni-RGPT，这是一种多模态大型语言模型，旨在促进图像和视频的区域级理解。为了在
机器学习笔记——Boosting中常用算法（GBDT、XGBoost、LightGBM）迭代路径好评笔记机器学习笔记机器学习 boosting 人工智能深度学习 AI 算法工程师
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文主要阐述Boosting中常用算法（GBDT、XGBoost、LightGBM）的迭代路径。文章目录XGBoost相对GBDT的改进引入正则化项，防止过拟合损失函数L(yi,y^i)L(y_i,\hat{y}_i)L(yi,y^i)正则化项Ω(fm)\Omega(f_m)Ω(fm)使用二阶导数信息，加速收敛一阶导数与二
RPA财务机器人是什么，RPA的具体应用场景有哪些？| 实在RPA研究实在智能RPA rpa 机器人自动化人工智能数字员工
越来越多的人工智能及超自动化技术在企业财务工作中得以普及应用，以提升财务工作效率，促进财务部门实现全面数字化转型。RPA财务机器人是什么？RPA，即机器人流程自动化（RoboticProcessAutomation），允许软件机器人（或“机器人”）自动执行重复性、规律性强的业务流程任务。RPA软件机器人可以模仿人类用户的行为，通过用户界面与应用程序交互，执行任务如数据输入、报告生成、数据迁移、邮件
全球人形机器人的创新发展与未来趋势 Gearidea 机器人机器人
随着科技的迅猛进步，人形机器人作为人工智能与机器人技术交汇的产物，正在全球范围内引发广泛关注。人形机器人以其仿人的外观和行为，不仅在工业生产领域展现出巨大的潜力，而且在日常生活中也逐渐发挥着不可忽视的作用。本文将全面剖析全球人形机器人的发展现状，展望未来发展的潜在趋势，并深入探讨其在不同领域中的应用和影响。一、全球人形机器人行业的发展现状全球人形机器人领域经历了从概念提出、原型制作到商业化应用的演
5分钟搞定Spring AI支持SpringBoot快速构建人工智能AI应用_springai_springboot_AI应用 web17886480312 spring 人工智能 spring boot
通过阅读这篇文章，你将了解SpringAI，它是一个借鉴了langchain的设计理念，并结合Java的优势，为开发者提供易于替换实现的统一接口。此外，文章还基于SpringAI的模型调用和Prompt模板，构建一个可操作的示例，让你可以快速的了解具体怎么在springboot的环境下使用springai来构建人工智能AI的应用SpringAI：简化Java大模型集成的统一框架在Java调用大模型
3.ChatClient&Chat Model简化与AI模型的交互 laopeng301 Spring AI 人工智能交互
1.ChatModel对话模型是一种利用人工智能技术，能够生成类似人类对话响应的工具。通过向预训练语言模型（如GPT等）发送提示词或部分对话内容，模型依据自身训练数据及对自然语言模式的理解，生成对话的延续或完整回复，并返回给应用程序。应用程序可以将其呈现给用户或用于进一步处理。SpringAIChatModelAPI设计目标为简单且可移植的接口，用于与各种人工智能模型进行交互，使开发人员能够在不同
《智守数据堡垒——AI驱动的MySQL数据治理合规框架》墨夶数据库学习资料2 人工智能 mysql 数据库
在当今数字化转型加速的时代，企业面临着前所未有的数据挑战。一方面，海量的数据为企业带来了巨大的商业价值；另一方面，如何确保这些数据的安全性、一致性和合法性成为了亟待解决的问题。尤其是在金融、医疗等高度监管行业中，任何数据泄露或不当使用都可能导致严重的法律后果和社会影响。为此，构建一个既高效又能满足法律法规要求的数据治理体系显得尤为重要。今天，我们将探讨一种创新性的解决方案——利用人工智能（AI）技
机器学习02-发展历史补充坐吃山猪机器学习机器学习人工智能
机器学习02-发展历史补充文章目录机器学习02-发展历史补充1-机器学习个人理解1-初始阶段：统计学习和模式识别（20世纪50年代至80年代）2-第二阶段【集成时代】+【核方法】（20世纪90年代至2000年代初期）3-第三阶段【特征工程】+【模型优化】（2000年代中期至2010年代初期）4-大规模数据和分布式计算（2010年代中后期）5-自动化机器学习和特征选择（2010年代末至今）2-神经网
Python数据分析高频面试题及答案闲人编程程序员面试 python 数据分析面试题核心
目录1.基础知识2.数据处理3.数据可视化4.机器学习模型5.进阶问题6.数据清洗与预处理7.数据转换与操作8.时间序列分析9.高级数据分析技术10.数据降维与特征选择11.模型评估与优化12.数据操作与转换13.数据筛选与分析14.数据可视化与报告15.数据统计与分析16.高级数据处理以下是一些Python数据分析的高频核心面试题及其答案，涵盖了基础知识、数据1.基础知识问1：Python中列表
Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
PCL 点云高程渲染：实现点云高程信息的颜色渲染技术征服冒险 PCL
PCL点云高程渲染：实现点云高程信息的颜色渲染点云渲染在计算机视觉和图形学中具有重要的应用价值。在处理点云数据时，一种常见的需求是通过将高程信息映射到颜色空间，以实现对点云的可视化。本文将介绍如何使用PCL（PointCloudLibrary）库实现点云的高程渲染，并提供相应的源代码。引言在开始之前，我们首先需要了解点云的基本概念。点云是由大量的三维点组成的数据集合，每个点都具有X、Y和Z坐标。点
Python机器学习之XGBoost从入门到实战(基本理论说明) 雪域枫蓝 Python Atificial Intelligence 机器学习 python 分布式
Xgboost从基础到实战XGBoost:eXtremeGradientBoosting*应用机器学习领域的一个强有力的工具*GradientBootingMachines(GBM)的优化表现，快速有效—深盟分布式机器学习开源平台(DistributedmachinelearningCommunity，DMLC)的分支—DMLC也开源流行的深度学习库mxnet*GBM：Machine：机器学习模型
【数据分析岗】关于数据分析岗面试python的金典问题+解答，包含数据读取、数据清洗、数据分析、机器学习等内容摇光~ 数据分析面试 python
大家好，我是摇光~，用大白话讲解所有你难懂的知识点最近和几个大佬交流了，说了很多关于现在职场面试等问题，然后也找他们问了问他们基本面试的话都会提什么问题。所以我收集了很多关于python的面试题，希望对大家面试有用。类别1：数据读取与处理问题1：如何用Python从Excel文件中读取数据？答：在Python中，可以使用pandas库从Excel文件中读取数据。pandas提供了read_exce
【Python篇】深入机器学习核心：XGBoost 从入门到实战半截诗 Python python 机器学习深度学习分类回归数据分析 XGBoost
文章目录XGBoost完整学习指南：从零开始掌握梯度提升1.前言2.什么是XGBoost？2.1梯度提升简介3.安装XGBoost4.数据准备4.1加载数据4.2数据集划分5.XGBoost基础操作5.1转换为DMatrix格式5.2设置参数5.3模型训练5.4预测6.模型评估7.超参数调优7.1常用超参数7.2网格搜索8.XGBoost特征重要性分析9.高级功能扩展9.1模型解释与可解释性9.2
【YOLOv8杂草作物目标检测】 stsdddd YOLO目标检测目标检测 YOLO 目标检测人工智能
YOLOv8杂草目标检测算法介绍模型和数据集下载算法介绍YOLOv8在禾本科杂草目标检测方面有显著的应用和效果。以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。该系统支持图片、视频以及摄像头进行目标检测，并能保存检测结果。系统界面可实时显示目标位置、目标总数、置信度、用时等信息。YOLO
提升数据科学工作流效率的10个Jupyter Notebook高级特性
JupyterNotebooks已成为数据科学家、机器学习工程师和Python开发人员的核心开发工具。其核心优势在于提供了一个集成式环境，支持代码执行、文本编辑和数据可视化的无缝整合。尽管大多数用户熟悉其基本功能，但许多能显著提升工作效率的高级特性往往被忽视。本文将介绍一些高级功能，帮助您在数据科学项目中充分发挥JupyterNotebooks的潜力。1、Magic命令：高效的命令行接口Jupyt
Python 数据建模完整流程指南木觞清 3天入门Python python 开发语言
在数据科学和机器学习中，建模是一个至关重要的过程。通过有效的数据建模，我们能够从原始数据中提取有用的洞察，并为预测或分类任务提供支持。在本篇博客中，我们将通过Python展示数据建模的完整流程，包括数据准备、建模、评估和优化等步骤。1.导入必要的库在进行任何数据分析或建模之前，首先需要导入必需的Python库。这些库提供了各种工具和算法，帮助我们更高效地完成任务。importnumpyasnpim
深度学习常用格式转化脚本xml2yolo/coco2yolo/bdd2yolo/frame2video等 qq1309399183 计算机视觉实战项目集合深度学习人工智能格式转化脚本 voc2yolo格式转化数据集格式转换 xml2yolo coco2yolo
文章目录1.**数据集格式转换脚本**`coco2yolo.py`示例注释：注释说明：`xml2yolo.py`示例注释：注释说明：2.**数据集可视化与统计**`vis_yolo_files.py`示例注释：注释说明：3.**其他工具脚本**`frames2video.py`示例注释：注释说明：该项目提供了一系列用于深度学习的数据处理工具，主要功能包括：数据集格式转换：提供多种脚本，将不同格式的
NVIDIA下一代Hopper架构曝光，采用5nm工艺晶体管超1400亿 Java小海. 架构人工智能后端程序人生 java
据媒体报道，NVIDIA下一代主要面向高性能计算、人工智能等Hopper架构，将会采用5nm工艺制程，晶体管多达1400亿个，面积核心达到了900平方毫米，是有史以来最大的GPU。作为参考，NVIDIA自家旗舰Ampere架构的A100为542亿个晶体管（每平方毫米约为6560万个晶体管），AMD阵营中采用Aldebaran架构的InstinctMI200系列为582亿个晶体管（每平方米约为736
NVIDIA Hopper解说白总Server redis 数据库缓存 rust mongodb 大数据数据仓库
NVIDIAHopper架构是NVIDIA推出的面向高性能计算（HPC）和人工智能（AI）的最新一代GPU架构。它代表了NVIDIA在加速计算领域的最新进展，旨在为AI训练和推理、HPC应用提供前所未有的性能提升。NVIDIAHopper架构和基于该架构的GPU产品H100的详细信息：NVIDIAHopper架构技术特点：第四代TensorCore：Hopper架构引入了第四代TensorCore
LLMs，即大型语言模型 maopig AI 语言模型人工智能自然语言处理
LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。LLMs在众多领域都有广泛的应用，如自然语言理解（NLU），语言生成，以及语音识别和合成等。例如，它们能够理解人类的语言
第79期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.TrojanWhi
第60期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能语言模型网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.映射你的模型：评估
YOLOv10-1.1部分代码阅读笔记-base.py 红色的山茶花 YOLO 笔记深度学习
base.pyultralytics\data\base.py目录base.py1.所需的库和模块2.classBaseDataset(Dataset):1.所需的库和模块#UltralyticsYOLO,AGPL-3.0licenseimportglobimportmathimportosimportrandomfromcopyimportdeepcopyfrommultiprocessing.
全新 Hopper 架构的Transformer 引擎有什么特点？扫地的小何尚人工智能
Transformer引擎是全新Hopper架构的一部分，将显著提升AI性能和功能，并助力在几天或几小时内训练大型模型。Transformer模型是当今广泛使用的语言模型（例如asBERT和GPT-3）的支柱。Transformer模型最初针对自然语言处理用例而开发，但因其通用性，现在逐步应用于计算机视觉、药物研发等领域。与此同时，模型大小不断呈指数级增长，现在已达到数万亿个参数。由于计算量巨大，
大语言模型（LLMs）入门教程（非常详细）从零基础入门到精通，看完这一篇就够了大模型零基础教程语言模型人工智能自然语言处理大模型
大语言模型（LLMs）作为人工智能（AI）领域的一项突破性发展，已经改变了自然语言处理（NLP）和机器学习（ML）应用的面貌。这些模型，包括OpenAI的GPT-4o和Google的gemini系列等，已经展现出了在理解和生成类人文本方面的令人印象深刻的能力，使它们成为各行各业的宝贵工具。如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage
1.8 GPT-4：开创人工智能的新纪元少林码僧 AI大模型应用实战专栏人工智能
GPT-4：开创人工智能的新纪元自从OpenAI推出GPT-4以来，人工智能领域经历了显著的突破。作为“生成预训练转换器”家族中的最新成员，GPT-4不仅在功能上进行了提升，更在语言处理能力、理解深度以及适应性方面带来了全新的变革。本篇文章将深入探讨GPT-4的特点、创新以及它如何定义未来人工智能技术的发展。GPT-4的技术亮点1.规模与深度的进一步提升GPT-4的规模比前代模型更大，训练数据量和
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓