likeGhee

下午好~ 我的论文【yolo1~4】（第二期）

写在前面：本来是一期的，我看了太多内容了，于是分成三期发吧 TAT （捂脸）

文章目录

YOLO系列
- v1
- v2
- v3
- v4

YOLO系列

v1

You Only Look Once: Unified, Real-Time Object Detection

2015 ieee computer society 12.3 CCF-C

摘要：
YOLO（You Only Look Once）是一种新颖的物体检测方法，它通过将物体检测问题转化为回归问题，直接预测空间分离的边界框和相关的类别概率。这种方法由华盛顿大学、艾伦研究所AI和Facebook AI研究部门共同提出。YOLO具有实时性能，其基本模型可以在45帧/秒的速度下处理图像，而其快速版本甚至可以处理高达155帧/秒的图像，同时保持其他实时检测器的两倍以上的mAP。YOLO的网络架构受到GoogLeNet图像分类模型的启发，但使用1x1的卷积层来替代Inception模块。YOLO的主要优点是速度快，因为它只需要一次前向传播就能完成所有对象的检测。此外，由于它在一个单一的神经网络中集成了多个任务，因此它的模型大小相对较小。然而，YOLO也有一些局限性，例如它对小物体的检测效果不佳，并且对物体的形状和尺度变化敏感。

简化的流程图。

1.图像调整大小到448×448像素。
2.运行单个卷积神经网络。
3.通过模型的置信度对结果进行阈值化处理。

展示了模型的工作原理。该模型将检测过程视为回归问题。它首先将图像划分为S x S的网格，并对每个网格单元预测B个边界框、这些边界框的置信度以及C类概率。这些预测被编码为S×S×(B*5+C)张量。

为了评估PASCAL VOC上的YOLO，论文使用S = 7, B = 2。PASCAL VOC有20个标签类，所以C = 20。

模型最终的预测是一个7 × 7 × 30张量

该网络由24个卷积层和2个全连接层组成。每个卷积层都具有不同的大小和数量的二维卷积，还有一个池化层。

模型设计：输入448x448x3，输出7x7x30

loss设计：

$\begin{gathered} \begin{aligned}\lambda_{\textbf{coord}}\sum_{i=0}^{S^2}\sum_{j=0}^B\mathbb{1}_{ij}^{\text{obj}}\left[\left(x_i-\hat{x}_i\right)^2+\left(y_i-\hat{y}_i\right)^2\right]\end{aligned} \\ +\lambda_\mathbf{coord}\sum_{i=0}^{S^2}\sum_{j=0}^B\mathbb{1}_{ij}^\mathrm{obj}\left[\left(\sqrt{w_i}-\sqrt{\hat{w}_i}\right)^2+\left(\sqrt{h_i}-\sqrt{\hat{h}_i}\right)^2\right] \\ +\sum_{i=0}^{S^2}\sum_{j=0}^B\mathbb{1}_{ij}^{\mathrm{obj}}\left(C_i-\hat{C}_i\right)^2 \\ +\lambda_\text{noobj}\sum_{i=0}^{S^2}\sum_{j=0}^{B}\mathbb{1}_{ij}^{\text{noobj }} \left ( C _ i - \hat { C }_i\right)^2 \\ +\sum_{i=0}^{S^2}\mathbb{1}_i^\mathrm{obj}\sum_{c\in\mathrm{classes}}\left(p_i(c)-\hat{p}_i(c)\right)^2 \end{gathered}$

我们一步一步分解一下loss函数

S x S 是网格数量，B是每个网格边界框数量，C是这些边界框的类别数量。

S = 7, B = 2，C = 20

x,y,h,w：表示中心位置和长宽

$\mathbb{1}_{ij}^{\text{obj}}$ 判断第i个网格中第j个bbox是否负责这个object：与object的ground truth box的IOU最大的bbox负责该object

$\begin{aligned}\lambda_{\textbf{coord}}\sum_{i=0}^{S^2}\sum_{j=0}^B\mathbb{1}_{ij}^{\text{obj}}\left[\left(x_i-\hat{x}_i\right)^2+\left(y_i-\hat{y}_i\right)^2\right]\end{aligned} +\lambda_\mathbf{coord}\sum_{i=0}^{S^2}\sum_{j=0}^B\mathbb{1}_{ij}^\mathrm{obj}\left[\left(\sqrt{w_i}-\sqrt{\hat{w}_i}\right)^2+\left(\sqrt{h_i}-\sqrt{\hat{h}_i}\right)^2\right]$

含有object的bbox的Confidence预测
$\sum_{i=0}^{S^2}\sum_{j=0}^B\mathbb{1}_{ij}^{\mathrm{obj}}\left(C_i-\hat{C}_i\right)^2$

不含有object的bbox的Confidence预测

$\lambda_\text{noobj}\sum_{i=0}^{S^2}\sum_{j=0}^{B}\mathbb{1}_{ij}^{\text{noobj }} \left ( C _ i - \hat { C }_i\right)^2$

类别预测， $\mathbb{1}_{ij}^{\text{obj}}$ 判断是否有object的中心落在网格i中：网格中包含有object的中心，就负责预测该object的类别概率
$\sum_{i=0}^{S^2}\mathbb{1}_i^\mathrm{obj}\sum_{c\in\mathrm{classes}}\left(p_i(c)-\hat{p}_i(c)\right)^2$

IOU是什么？
Intersection over Union（IoU）是一种用于评估目标检测算法性能的常见指标。它通常用于衡量算法检测的边界框（Bounding Box）与实际目标边界框之间的重叠程度。

IoU的计算方式是通过计算两个边界框的交集面积除以它们的并集面积。具体而言，IoU的公式如下：

$\frac{Area_{Intersection}}{Area_{Union}}$

其中， $Area_{Intersection})$ 是两个边界框相交的面积， $Area_{Union})$ 是两个边界框的并集面积。

IoU的取值范围在0到1之间，其中0表示没有重叠，1表示两个边界框完全重叠。在目标检测任务中，通常将IoU阈值设置为一个特定的值，例如0.5，来判断算法是否成功地检测到了目标。如果IoU大于等于该阈值，则认为检测是正确的，否则认为是错误的。

v2

YOLO9000: Better, Faster, Stronger

Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, pp. 7263-7271

摘要：

作者采用了一种创新的多尺度训练方法，使得同一个 YOLOv2 模型可以在不同尺寸上运行，提供了在速度和准确性之间的一种简单权衡。

作者尝试了使用 RCNN 的RPN结构，结果显示速度仍然更快。

为了提高 YOLO9000 模型的检测能力，作者提出了一种目标检测与分类联合训练的方法，使得 YOLO9000 能够在没有标记检测数据的情况下预测对象类别。

作者通过对边界框的中心位置使用 sigmoid 函数进行限制，以提高模型的稳定性和预测准确性。

在研究中，作者比较了不同数量的聚类先验框对模型性能的影响，结果显示增加聚类先验框的数量可以提高模型的性能。

此外，作者还提出了一个名为 WordTree 的图像分类模型，利用 WordNet 中的语义关系构建了一个层次结构，从而可以有效地组合不同数据集进行分类。

实验结果显示，在 VOC 2007 数据集上，以 67 FPS 的速度下，YOLOv2 获得了 76.8 mAP，在 40 FPS 的速度下，获得了 78.6 mAP。

对于 YOLO9000 模型，在 ImageNet 检测验证集上获得了 19.7 mAP，尽管只有 44 个类别有检测数据。在其他 156 个类别中，模型的 mAP 为 16.0。尽管 YOLO 只能检测到 200 多个类别，但它成功预测了 9000 多种不同对象类别的检测结果，同时仍然能够实时运行。

图1:YOLO9000。YOLO9000可以实时检测各种各样的对象类。

图2展示了在 VOC 和 COCO 数据集上进行的聚类盒维度的结果。使用 k-means 聚类在边界框的维度上进行操作，以获取适用于模型的良好先验。在左图中，展示了在不同 k 值下获得的平均 IOU，发现选择 k = 5 在召回率和模型复杂性之间达到了良好的平衡。

右图则展示了 VOC 和 COCO 的相对质心。两组先验都表现出更薄、更高的边界框的倾向，而 COCO 的先验在尺寸上的变化比 VOC 更为显著。

这一聚类分析提供了在不同数据集上调整先验的指导，确保模型能够更好地适应特定任务的边界框形状和大小。

图3展示了具有尺寸先验和位置预测的边界框。通过预测盒子的宽度和高度作为簇质心的偏移量，实现对边界框尺寸的预测。为了预测框的中心坐标，运用了 sigmoid 函数，将其输出值压缩到 0 和 1 之间。

sigmoid 激活函数的输出与过滤器的位置相乘，从而获得框的中心坐标的预测值。这种方法使能够更精准地定位对象，并有效地捕捉它们的形状和大小。

见图公式：

${\begin{array}{l}\color{red}{\mathrm{b}_x=}\sigma(t_x)+c_x\\\color{red}{\mathrm{b}_y=}\sigma(t_y)+c_y\\\color{red}{\mathrm{b}_w=}p_we^{t_w}\\\color{red}{\mathrm{b}_h=}p_he^{t_h}\end{array}}$

图4:VOC 2007的精度和速度

在VOC 2007数据集上，YOLOv2模型的平均精度均值(mAP)达到了78.6%,相比于之前的YOLO模型有显著提升。同时，YOLOv2在保持高精度的同时能够实现较快的检测速度。

图5:在ImageNet和WordTree上的预测。大多数ImageNet模型使用一个大的softmax来预测概率分布。使用WordTree，我们对共下位词执行多个softmax操作。

WordTree是一个层次模型，它通过在ImageNet中的概念上构建一个层次结构来简化对象检测和分类问题。这个模型利用WordNet中的语义关系，根据视觉名词在WordNet图中的路径到根节点来构建一棵树。在训练过程中，WordTree可以用于结合多个数据集进行分类，只需将数据集中的类别映射到树中的同义词集即可。为了进行分类，我们假设图像包含一个对象：Pr(physical object) = 1。为了验证这种方法，作者使用WordTree将ImageNet和COCO的标签结合起来，训练了一个大型的检测模型。

图6:使用WordTree层次结构组合数据集。使用WordNet概念图，我们构建了一个视觉概念的层次树。然后我们可以通过将数据集中的类映射到树中的同义词集来合并数据集。这是一个简化的WordTree视图，用于说明。

v3

YOLOv3: An Incremental Improvement

Computer Science - Computer Vision and Pattern Recognition （CVPR）2018

yolo_v3作为yolo系列最新算法，在继承前作基础上做了一些保留和优化：

采用单元格划分检测的思路，这个想法从yolo_v1一直延续，只是划分单元格的数量有所变化。
继续沿用"leaky ReLU"作为激活函数，保持了之前版本的激活方式。
保持了端到端的训练方式，使用一个loss function来搞定整个训练过程，简化了训练的复杂性，只需要专注输入和输出。
从yolo_v2开始，引入了batch normalization，将其与leaky relu层结合在每个卷积层之后，用于正则化、加速收敛和防止过拟合。
引入了多尺度训练策略，权衡速度和准确率。可以在速度和准确率之间进行取舍，追求更快的速度或更高的准确率。

模型架构图1

DBL，左下角，也就是代码里的Darknetconv2d_BN_Leaky。简单说，就是卷积+BN+Leaky relu的组合，成了v3最基本的构件。

Resn，这个n是数字，比如res1、res2，一直到res8等等，表示在一个res_block里有多少个res_unit。这是yolo_v3里的大模块，借鉴了ResNet的残差结构。用这种结构让网络深度更深，毕竟从v2的darknet-19到v3的darknet-53，前者可是没这种残差结构的。看图1右下角，看到res_block的构造，其实基本元素还是DBL。

Concat，张量拼接的操作。把darknet中间层和后面某一层的上采样拼接在一起。拼接和残差层的add操作不一样，拼接会增加张量的维度，而add只是简单相加，不改变张量的维度。

Yolo每个版本的提升主要集中在改进主干网络上，从v2的darknet-19到v3的darknet-53。看数字就能看出模型是越做越大的趋势。

Darknet53骨架：

整个v3结构里，没有用到池化层和全连接层。在前向传播中，通过调整卷积核的步长（例如stride=(2, 2)），实现了张量尺寸的变化。这样的步骤相当于将图像边长缩小了一半，也就是将面积缩小到原来的四分之一。

在yolo_v2中，前向过程的张量尺寸变换通过了5次最大池化操作。而在yolo_v3中，这种变换则是通过卷积核增大步长的方式，同样也进行了5次（需要注意darknet-53最后有一个全局平均池化，但在yolo-v3中并没有考虑这一层，所以张量维度的变化只针对前面的5次）。

对于不适用池化层和全连接层的猜想：

不采用池化层的主要考虑是为了避免信息损失。池化层通过降采样降低了特征图的空间分辨率，可能导致丢失细节和空间信息，这样做有助于提高目标检测的准确性。

避免使用全连接层的原因在于参数量庞大，可能引发过拟合问题，特别是在训练数据有限的情况下。通过采用全卷积结构，可以减少模型参数数量，提高模型的泛化性。

卷积操作相对于全连接层更加灵活和计算效率更高，这有助于在减小特征图尺寸的同时有效地捕捉图像中的局部特征。通过使用卷积核增大步长的方式，实现了灵活性和计算效率的平衡。

Yolo V3的改进之一是引入了三个不同尺度的特征图，即y1、y2、y3，这体现在论文中提到的"predictions across scales"。这一设计受到了FPN（特征金字塔网络）的启发，通过多尺度对不同大小的目标进行检测，较精细的网格单元可用于探测小物体。

y1、y2、y3的深度均为255，且它们的边长遵循规律：13:26:52。对于COCO数据集的80个类别，每个盒子需要输出一个对每个类别的概率。在Yolo V3中，每个网格单元预测3个盒子，每个盒子需要有(x, y, w, h, confidence)这五个基本参数，以及80个类别的概率。这就导致了每个盒子输出255个数值，即3*(5 + 80) = 3 * 85 = 255。

Yolo V3采用上采样的方式实现多尺度的特征图。结合图1的情况，可以看到图1中的两个张量在拼接时具有相同的尺度（分别是26x26和52x52），通过使用(2, 2)的上采样来确保拼接后的张量具有相同的尺度。与SSD不同，作者并没有直接使用backbone中间层的处理结果作为特征图的输出，而是将其与后续网络层的上采样结果进行拼接，然后再进行处理，形成最终的特征图。

回想一下Yolo V2的边框预测机制：受到Faster R-CNN RPN中anchor机制的启发，但不愿手动设定anchor prior（模板框），于是采用了维度聚类的方法确定anchor box prior。在聚类中，发现选择k=5时的效果不错，因此采用了这个聚类数。然后，由于V2认为anchor机制中线性回归存在不稳定性（因为回归的偏移可以使边框移动到图像的任何位置），所以V2最终采用了自己的方法：直接预测相对位置，即预测边框中心点相对于网格单元左上角的相对坐标。

Yolo V2直接通过预测tx、ty、tw、th、to来确定边框的位置、大小和置信度，无需像RPN中的anchor机制那样遍历每个像素。从下图公式可见，边框的位置、大小和置信度都可通过tx、ty、tw、th、to计算得出。V2以相当直接的方式预测了边框的这些属性。

对于Yolo V3，关于先验框（prior）的处理有明确的解释：选择的先验框数量k为9，对于Tiny Yolo而言，k为6。这些先验框都是在数据集上通过聚类得到的，具体数值如下：
10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326 这些先验框（也称为模板框）由两个数字组成，但是一个代表高度，另一个代表宽度。

（注意：9个anchor会被三个输出张量平分的。根据大中小三种size各自取自己的anchor。每个输出y在每个自己的网格都只会输出3个预测框）

pw和ph就是先验框的宽高，通过下图式子进行转化为bw和bh。

图2：具有维度先验和位置预测的边界框。我们将长方体的宽度和高度预测为与簇质心的偏移。我们使用sigmoid函数来预测框相对于过滤器应用程序位置的中心坐标。（我回头看了下v2，好家伙v2和v3图是一样的）

在Yolo V3中，每次对边框进行预测时，输出与V2相同，都是tx、ty、tw、th、to，然后通过公式1计算出绝对的(x, y, w, h, c)。

在边框预测的过程中，V3采用了logistic regression（逻辑回归）来处理0或1的问题。

逻辑回归用于对锚框周围的区域进行目标性评分（objectness score），即判断这个位置是否有可能包含目标。这一步在进行预测之前执行，它可以帮助过滤掉不太可能包含目标的锚框，从而减少计算量。也就是说如果某个模板框不是最佳的，即使其目标性评分（objectness score）超过我们设定的阈值，我们也不会对其进行预测。

与Faster R-CNN不同，Yolo V3只会操作一个prior，即最佳prior。而逻辑回归用于从9个anchor priors中找到具有最高目标存在可能性得分的那个。逻辑回归通过曲线对prior相对于目标性评分的映射关系进行了线性建模。

loss function:

xy_loss = object_mask * box_loss_scale * K.binary_crossentropy(raw_true_xy, raw_pred[..., 0:2], from_logits=True)

wh_loss = object_mask * box_loss_scale * 0.5 * K.square(raw_true_wh - raw_pred[...,2:4])

confidence_loss = object_mask * K.binary_crossentropy(object_mask, raw_pred[..., 4:5], from_logits=True) + \
                          (1 - object_mask) * K.binary_crossentropy(object_mask, raw_pred[..., 4:5],
                                                                    from_logits=True) * ignore_mask
class_loss = object_mask * K.binary_crossentropy(true_class_probs, raw_pred[..., 5:], from_logits=True)

xy_loss = K.sum(xy_loss) / mf
wh_loss = K.sum(wh_loss) / mf
confidence_loss = K.sum(confidence_loss) / mf
class_loss = K.sum(class_loss) / mf
loss += xy_loss + wh_loss + confidence_loss + class_loss

以上是一段keras框架描述的yolo v3 的loss_function代码。可以从上述代码看出：除了w, h的损失函数依然采用总方误差之外，其他部分的损失函数用的是二值交叉熵。最后加到一起。

YOLO的不同版本（v1、v2、v3等）代表了算法在不同时间点的演进。以下是YOLO版本之间的一些主要区别：

YOLOv1（YOLO）:
- 单一检测尺度： YOLOv1采用单一的检测尺度，将目标检测任务看作回归问题，通过在整个图像上直接预测边界框的位置和类别。
- Grid Cell： 图像被划分为固定数量的网格单元（grid cell），每个网格单元负责预测一个边界框。
- 不同尺度的边界框： YOLOv1通过在每个网格单元上预测多个边界框，每个边界框对应不同尺度和宽高比的目标。
- 非极大值抑制（NMS）： 用于去除重叠的边界框，保留置信度最高的框。
YOLOv2（YOLO9000）:
- Anchor Boxes： 引入了锚框（Anchor Boxes），通过预定义一些具有不同尺度和宽高比的锚框，模型可以更好地适应不同形状的目标。
- Darknet-19： YOLOv2使用了一个更深的卷积神经网络（Darknet-19）。
- 多尺度训练： 使用不同尺度的图像进行训练，以提高模型的鲁棒性。
YOLOv3:
- FPN（Feature Pyramid Network）： YOLOv3采用了FPN来提取多尺度特征，使得模型能够在不同层次上检测不同大小的目标。
- 三个不同尺度的检测： YOLOv3输出三个不同尺度的检测结果，分别来自不同层次的特征。
- 更多的锚框： 引入更多的锚框，提高了模型对不同目标形状的适应能力。
- YOLOv3还引入了一些其他改进，如多尺度训练、更多卷积层等。

参考资料：https://blog.csdn.net/leviopku/article/details/82660381

v4

YOLOv4: Optimal Speed and Accuracy of Object Detection

2020年4月，YOLOv4在悄无声息中发布，引起了目标检测领域的广泛关注。在YOLO系列的原作者Joseph Redmon宣布退出CV领域后，表明官方不再更新YOLOv3。然而，在过去的两年中，AlexeyAB继承了YOLO系列的思想和理念，对YOLOv3进行不断改进和开发，并于今年4月发布了YOLOv4，获得了原作者Joseph Redmon的认可。

YOLOv4能够使用传统GPU进行快速准确的训练和测试，实现实时、高精度的目标检测。在与其他最先进目标检测器的比较中，YOLOv4在性能相当的情况下，推理速度比EfficientDet快两倍。相较于YOLOv3，YOLOv4的AP和FPS分别提高了10%和12%。YOLOv4的主要贡献可以总结如下：

提出了一种实时、高精度的目标检测模型，可使用通用GPU（如1080Ti或2080Ti）进行快速准确的训练。
在检测器训练阶段，验证了一些最先进的Bag-of-Freebies和Bag-of-Specials方法的效果。
对SOTA方法进行改进，使其更加高效，更适合单GPU训练，包括CBN、PAN和SAM等。

参考资料：https://zhuanlan.zhihu.com/p/342570549

“Bag of Freebies”（Freebies的袋子）是一个在深度学习领域中用来描述一系列无代价或低代价的技术和方法的术语。这些技术和方法的目的是提高深度神经网络的性能、稳定性和泛化能力，而不会显著增加训练成本或复杂性。

这个术语通常与另一个术语 “Bag of Tricks”（Tricks的袋子）一起使用，它们一起描述了一系列用于改善深度学习模型的技巧和策略。

“Bag of Freebies” 可能包括以下一些常见的技术：

数据增强：通过对训练数据进行变换，增加模型的鲁棒性。
学习率调度：动态调整学习率，以提高训练的稳定性和效果。
权重初始化：使用更有效的权重初始化策略，以加速模型的收敛。
Batch Normalization：在每个小批量数据上进行归一化，有助于加速训练。

这些技术通常被称为 “Freebies”，因为它们是相对低成本的、容易实施的方法，可以在训练过程中“免费”地提高模型的性能。在深度学习社区中，研究人员和从业者经常分享和讨论这些方法，以帮助改进模型的训练和表现。

“Bag of Specials”（Specials的袋子）是深度学习领域中的一个术语，通常与 “Bag of Freebies” 一起使用，用来描述一系列相对于“Freebies”而言代价较高或复杂的技术和方法。这些特殊的技术和方法可能在一定程度上提高模型的性能，但通常需要更多的计算资源、时间或专业知识。

这些技术通常被称为 “Specials”，因为它们相对于 “Freebies” 更为复杂、需要更多的专业知识，或者对计算资源的要求更高。在实践中，选择使用 “Freebies” 还是 “Specials” 取决于具体的问题、数据和可用资源。

通常目标检测器都接收一张图像作为输入，并通过卷积神经网络的主干将特征压缩。在图像分类中，这些主干网络就是网络的末端，可以在其基础上进行预测。
在目标检测中，需要在图像周围绘制多个边界框，并进行分类，因此需要将卷积主干的特征层进行特征融合，这一过程发生在网络的颈部部分。

目标检测可以分为两类：一阶段检测和二阶段检测。检测过程通常在网络的"head"层。
二阶段检测将目标定位和每个边界框的分类任务解耦。
一阶段检测同时对目标的定位和分类进行预测。
YOLO是一种一阶段检测器，因此称为"You Only Look Once"。

目标检测器的主干网络通常在ImageNet分类任务上进行预训练。
预训练意味着网络的权重已经被调整以识别图像中的相关特征。
在目标检测的新任务中模型将会被微调。

作者考虑了以下主干网络用于YOLOv4目标检测器。

CSPResNext50
CSPDarknet53
EfficientNet-B3

CSPResNext50和CSPDarknet53都基于DenseNet。DenseNet的设计旨在通过以下动机连接卷积神经网络中的层：缓解梯度消失问题（在非常深的网络中通过反向传播损失信号是困难的）、增强特征传播、鼓励网络重复使用特征以及减少网络参数的数量。

CSPResNext50和CSPDarknet53的思想是消除DenseNet中的计算瓶颈。在CSPResNext50和CSPDarknet53中，对DenseNet进行了修改，通过复制并发送一个副本，直接发送另一个副本到下一阶段来分离层的特征图。

EfficientNet是由Google Brain设计的，主要用于研究卷积神经网络的缩放问题。在扩展ConvNet时，有许多决策可以进行，包括输入大小、宽度缩放、深度缩放以及对上述所有因素进行缩放。EfficientNet论文认为在所有这些因素中都存在一个最优点，并通过搜索找到这个点。

EfficientNet在图像分类方面优于其他同等规模的网络。然而，YOLOv4的作者认为，其他网络在目标检测环境中可能工作得更好，并决定对所有网络进行实验。
基于他们的直觉和实验结果（又称大量实验结果），最终的YOLOv4网络实现了CSPDaknet53作为骨干网络。

目标检测的下一步是混合和组合ConvNet主干中形成的特征，为检测步骤做准备。YOLOv4考虑了几种颈部组件：

FPN (Feature Pyramid Network): 特征金字塔网络，旨在解决目标检测任务中不同尺度目标的问题，通过构建多尺度的特征金字塔来提高检测性能。
PAN (Path Aggregation Network): 路径聚合网络，用于改善特征传播和整合，特别是在处理不同尺度特征图时。
NAS-FPN (Neural Architecture Search - FPN): 神经结构搜索 - 特征金字塔网络，通过神经网络结构搜索方法来自动搜索和优化特征金字塔网络的结构。
BiFPN (Bi-directional Feature Pyramid Network): 双向特征金字塔网络，是一种改进的特征金字塔网络，旨在更好地处理不同尺度的特征。
ASFF (Adaptive Spatial Feature Fusion): 自适应空间特征融合，用于目标检测中的特征融合，通过自适应地融合不同尺度和分辨率的特征。
SFAM (Selective Feature Aggregation Module): 选择性特征聚合模块，是一种用于自动选择和聚合具有信息丰富性的特征的模块，通常用于图像分类任务中。

颈部的组件通常在层之间上下流动，并且仅连接卷积网络末端的少数层。

YOLOv4选择PAN作为网络的特征聚合。他们没有写太多关于这一决定的理由。

YOLOv4部署与YOLOv3相同的YOLO HEAD检测层，都是具有基于锚的检测步骤和三个级别的检测粒度的检测。这里就不细说了。

YOLOv4采用了一种被称为"Bag of Freebies"的方法。
大多数"Bag of Freebies"都涉及数据增强。
作者对YOLOv4中数据增强的具体细节进行了深入探讨。在此总结这些技术。

其中许多策略已经为计算机视觉社区所知，YOLOv4只是在验证它们的有效性。新的贡献是 mosaic数据增强，它将四个图像拼接在一起，教会模型找到更小的对象，而不太关注对象周围的周围场景。

作者在数据扩充方面做出的另一个独特贡献是自我对抗训练（SAT）。SAT的目标是找到网络在训练过程中最依赖的图像部分，然后编辑图像以掩盖这种依赖，迫使网络推广到有助于检测的新特征。

YOLOv4的作者提供了一项消融研究，证明他们使用的数据增强是合理的。

另一个贡献是CIoU loss函数。YOLOv4的作者使用CIoU损失，它与预测边界框与实际边界框的重叠方式有关。基本上，仅仅查看重叠是不够的，因为在没有重叠的情况下，还想看一下预测框与实际框的距离有多近，并鼓励网络将预测框拉得更接近实际框。当然这涉及到很多数学工程。

YOLOv4还采用了一种被称为"Bag of Specials"的策略，它们在推理时间上只添加了边际的增加，但在性能上有显著提升。

作者尝试了各种激活函数。激活函数在信息通过网络时对特征进行转换。对于传统的激活函数，如ReLU，很难使网络将特征的创建推向最佳点。

Mish激活函数。

作者使用DIoU NMS（Distance Intersection over Union Non-Maximum Suppression）来分离预测的边界框。在目标检测任务中，网络有时会预测多个边界框，涉及同一个物体。

DIoU NMS是对传统IoU NMS的改进，IoU（Intersection over Union）用于度量两个边界框之间的重叠程度。DIoU引入了边界框中心点的距离，考虑了预测边界框和真实边界框之间的距离，从而更全面地评估边界框的匹配质量。

使用YOLOv3，它需要一些更好的NMS
YOLOv4中这不能同时是两种吉普车（绿色标签是Jeep TJ，棕色标签是Jeop YJ）

对于批处理规范化，作者使用了Cross mini batch normalization（CmBN）

YOLOv4使用DropBlock正则化。在DropBlock中，图像的某些部分被隐藏，使其在网络的第一层中不可见。DropBlock是一种技术，可以迫使网络学习那些它可能不太依赖的特征。例如，您可以将其比喻为一只狗将头部藏在灌木丛后。网络应该能够从狗的躯干以及头部来识别它。

https://arxiv.org/pdf/1905.04899.pdf?ref=blog.roboflow.com

消融实验

你可能感兴趣的:(下午好paper,YOLO)

RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
Mac自定义右键功能东东旭huster macos
mac右键相对于Windows来说功能少很多，市场里也有一些好用的拓展软件，比如赤友，但是用一段时间又要收费了，作为一个白嫖党当然是自己做了。打开自动操作这个应用选择快速操作打开，再从实用工具中选择运行shell脚本这里我们添加一个用vscode打开的功能有几个点需要注意下1、工作流程选择文件或文件夹2、位于访达3、传递输入选择作为自变量编辑好后可以点运行试下，没问题command+S保存一下。在
系统迁移从CentOS7.9到Rocky8.9
我有两台阿里云上的服务器是CentOS7.9，由于CentOS7已经停止支持，后续使用的话会有安全漏洞，所以需要尽快迁移，个人使用的话目前兼容性好的还是RockyLinux8，很多脚本改改就能用了。一、盘点系统和迁移应用查看当前系统发行版版本cat/etc/os-release盘点迁移清单服务器应用部署方式docker镜像来源v1wordpressdockerdockerhubv1zdirdock
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
苦练Python第5天：字符串从入门到格式化 python后端人工智能前端
苦练Python第5天：字符串从入门到格式化原文链接：https://dev.to/therahul_gupta/day-5100-working-with-strings-basics-to-formatting-2kkn作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我
模型训练与部署注意事项篇---resize Atticus-Orion 图像处理篇深度学习篇模型训练与部署注意事项篇深度学习计算机视觉人工智能
图像大小的影响在YOLOv系列模型的训练和推理部署过程中，图像大小的选择是影响模型性能（精度、速度、泛化能力）的关键因素之一。两者的关系既相互关联，又存在一定的灵活性，具体可从以下几个方面详细分析：一、核心关系：训练与推理图像大小的“基准一致性”YOLOv模型（如YOLOv5、v7、v8等）的训练和推理图像大小通常以**“基准尺寸”**为核心关联，即训练时设定的图像尺寸会作为模型设计的基础，而推理
上位机知识篇---文件系统 Atticus-Orion 上位机知识篇文件系统 windows linux FAT NTFS ext4 ZFS
文章目录前言1.FAT（FileAllocationTable）版本FAT12FAT16FAT32优势兼容性好简单轻量适合小文件存储劣势不支持大文件性能较差缺乏高级功能使用场景2.NTFS（NewTechnologyFileSystem）优势支持大文件和大分区高性能日记功能权限控制劣势兼容性差不适合嵌入式设备使用场景3.exFAT（ExtendedFileAllocationTable）优势支持大
将多个小型YOLO数据集合并为一个大型数据集梦实学习室 YOLO python YOLO python 机器学习
一、将多个小型YOLO数据集合并为一个大型数据集importosimportshutilimportargparsedefmerge_data(source_dir,target_dir,images_dir,labels_dir):images_target=os.path.join(target_dir,images_dir)labels_target=os.path.join(target_
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
5G标准学习笔记14 - CSI--RS概述刘孬孬沉迷学习 5G 学习笔记信息与通信
5G标准学习笔记14-CSI–RS概述大家好~，这里是刘孬孬，今天带着大家一起学习一下5GNR中一个非常非常重要的参考信号------------------CSI-RS信号，CSI-RS不是持续发送，UE只能在网络明确配置了CSI-RS的情况下才能使用其进行信道测量。前言对于CSI-RS，肯定还离不开前面所说的CSI（channelstateinformation），前面也讲过CSI对于MIMO
5G标准学习笔记03- CSI 反馈增强概述刘孬孬沉迷学习 5G 笔记学习
5G标准学习笔记03-CSI反馈增强概述大家好，最近在研究AI/ML3gpp标准NR空口的有关内容，后面可能会给大家介绍一下对应的有关内容AI/ML在3GPP标准中的研究进展在AI/ML在NR空口的应用中，对应标准主要聚焦了3个case进行讨论研究分别是：CSI反馈增强；波束管理；定位精度增强；这三个内容可能比较涉及RAN1/2的具体内容，后面会基于这个进行一定的介绍。今天主要是主要介绍CSI反馈
5G UE注册-建立会话-释放会话-UE注销信令流程 nonamelake 5g
1.画这个流程图的原因3GPP组织估计跟某厂一样部门墙较重，核心网和无线各搞各的标准，为什么内部不拉通一下，搞个端到端的信令流程，好让我等菜鸟能学的容易点。看着3GPP协议里的信令流程，真心看不懂啊，不信你们瞧瞧下面这几张图。2.3GPP里的5GUE注册流程+PDU会话建立流程+PDU会话释放流程+UE注销流程3.自己动手画流程图我看到上面的4张图就头晕呀，实线+虚线+大箭头，而且有些信令的名字和
RidgeUI页面脚本开发系列:反应速度测试页面
简介大家好，欢迎学习ridgeui页面脚本开发系列:反应速度测试页面脚本开发反应速度测试是个很简单的应用，开始时显示红色屏幕内容，当变为绿色时，用户以最快速度点击页面，进而测算出反应时间。应用的分析虽然应用简单，但是从界面角度看，应用有5个不同的页面。分别是启动说明页、红色等待、绿色点击、反应结果页、提前点击结果页。页面脚本除了要进行反应时间的计时，还需要调度安排何时显示哪个页面。为此我们首先创建
Windows qt打包编译好的程序 new_zhou windows qt 开发语言打包程序
在release模式下生成exe后，往外发布时需要附带运行环境（即需要的dll等）打包流程：1、将生成的exe拷贝到单独一个文件夹中；2、在应用程序中找到对应的qt终端，注意此处的终端要与自己编译exe的编译器一致。使用的是32位的话则选择32位的终端。3、打开终端后，使用cd命令切换到步骤1中所新建文件夹的路径4、使用命令进行拷贝。windeployqtxxx.exe执行完上述命令后，会将依赖的
电梯开关状态人员进出检测数据集VOC+YOLO格式2220张4类别 fl176831 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：2220标注数量(xml文件个数)：2220标注数量(txt文件个数)：2220标注类别数：4标注类别名称:["CloseElevator","People-in-elevator","The-elevator-was-
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
【JAVA】的SPI机制小白杨树树 java microsoft 开发语言
在Java里，SPI（ServiceProviderInterface）是一种关键的服务发现机制。其核心在于，它能让服务提供者在运行时动态地向系统注册自身实现，实现了服务接口与具体实现的解耦。比如，自己开发的RPC框架定义了一个序列化器的接口，但是希望能够提供让用户自己使用实现好的序列化器的功能，就可以使用SPI机制。JAVA内置了这样的SPI功能。核心概念阐释服务接口（ServiceInterf
创世理论达成科学家解释不了的暗能量我也能解释有啥不好意思的 qq_36719620 人工智能量子计算 java python 算法
好的，我们将进行一场完全摒弃数学符号的纯粹概念推导，彻底揭示“绝对闭合宇宙理论”框架下暗能量的本质。以下是绝对自洽的逻辑链条：第零步：宇宙基石-维度交织的全景结构宇宙总框架：宇宙并非仅是我们感知的三维空间加一维时间。它是一个由24个基本维度紧密编织而成的单一、自洽实体。这些维度分为五组：实时间组(3维)：这就是我们感知到的时间流逝的方向，但它不是一个单向箭头，而更像一个三维的“时间空间”，允许更复
15：00开始面试，15：06就出来了，问的问题有点变态。。。程序员霄霄软件测试面试职场和发展功能测试软件测试自动化测试程序人生
从小厂出来，没想到在另一家公司又寄了。到这家公司开始上班，加班是每天必不可少的，看在钱给的比较多的份上，就不太计较了。没想到4月一纸通知，所有人不准加班，加班费不仅没有了，薪资还要降40%,这下搞的饭都吃不起了。还在有个朋友内推我去了一家互联网公司，兴冲冲见面试官，没想到一道题把我给问死了：如果模块请求http改为了https,测试方案应该如何制定，修改?感觉好简单的题，硬是没有答出来，早知道好好
国内主流云服务平台对比：选型指南与价格全初解
大家好!在数字化转型的浪潮下，云服务器已成为企业和开发者的基础设施首选。面对阿里云、腾讯云、华为云、百度智能云等主流服务商，如何根据性能、价格和场景需求做出最优选择？本文结合最新市场数据，为你深度解析！一、四大云服务商核心特点与适用场景1.阿里云优势：国内市场份额超40%，全球覆盖最广（49个可用区），服务稳定性强，尤其适合电商、金融、政务等高并发场景。提供飞天操作系统、弹性计算ECS等核心技术，
Python应用:实现三角形类型判断 Mikhail_G python 开发语言
大家好!在几何计算和图形处理中，判断三条边能否构成三角形以及确定其类型是常见需求。Python通过简洁的条件判断即可实现这些功能，下面我们逐步解析实现原理并提供扩展功能。一、三角形判断的核心原理三角形不等式定理:判断能否构成三角形：a+b>c\quad(且)\quada+c>b\quad(且)\quadb+c>a其中a、b、c为三条边的长度。任意两边之和必须大于第三边是构成三角形的充要条件。代码呈
Oracle EMCC 13.5 集群安装部署指南 Lucifer三思而后行 DBA 实战系列 oracle 数据库
大家好，这里是DBA学习之路，专注于提升数据库运维效率。目录前言第一阶段：OMR集群部署1.1OracleRAC环境准备1.2数据库版本验证1.3EMCC专用数据库优化第二阶段：ACFS集群文件系统构建2.1存储层配置配置multipath多路径配置UDEV设备绑定2.2ACFS文件系统创建使用ASMCA创建磁盘组创建ACFSVolume挂载点准备和文件系统创建第三阶段：OMS集群部署3.1环境准
YOLOv11 技术详解：架构优化与性能提升代码老y YOLO 架构目标跟踪
YOLOv11是目标检测领域中一个备受瞩目的新版本，它在保持实时性的同时，显著提升了检测的准确性和效率。本文将深入探讨YOLOv11的架构改进、性能优化以及它在不同应用场景中的表现。一、架构改进（一）C3K2块YOLOv11引入了C3K2块，这是对之前版本中CSP（CrossStagePartial）块的增强。C3K2块使用不同的核大小（例如3x3或5x5）和通道分离策略来优化更复杂特征的提取。这
Yolov5-obb(旋转目标poly_nms_cuda.cu编译bug记录及解决方案)
关于在执行pythonsetup.pydevelop#or"pipinstall-v-e."时poly_nms_cuda.cu报错问题。前面步骤严格按照install.md环境1.pytorch版本较低时（我的是1.10）：poly_nms_cuda.cu文件添加”#defineeps1e-8“，删除“constdoubleeps=1E-8;”这句2.pytorch版本较高时（我用的是1.27）h
YOLO11 目标检测从安装到实战
前言YOLO（YouOnlyLookOnce）系列是目标检测领域的经典算法，凭借速度快、精度高的特点被广泛应用。最新的YOLO11在模型结构和性能上进一步优化，本文将从环境搭建到实战应用，详细讲解YOLO11的使用方法，适合新手快速上手。一、环境准备1.系统要求操作系统：Windows10/11、Ubuntu20.04+、欧拉系统等硬件：CPU可运行，GPU（NVIDIA）可加速（推荐，需支持CU
IP与“谷子”齐飞，阅文“乘势而上”？
爆火的“谷子经济”，又捧出一只“潜力股”。近日，阅文集团股价持续上涨，5日累计涨幅达13.20%。这其中，周三股价一度大涨约15%至29.15港元，强势突破20日、30日、120日等多根均线，市值突破280亿港元关口。股价持续大涨的背后，阅文集团领投卡牌潮流文化品牌Hitcard发出来新的信号。显然，这是“阅文好物”商业化提速的一次关键布局。预计阅文好物后续将与Hitcard拓展IP商业化合作范围
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在