zyw2002

目标检测 —— YOLOv2论文精读

arxiv 论文地址
yolov2代码pytorch版本

文章目录

- Abstract (摘要)
- 1. Introduction (简介)
- 2. Better (更好)
- - Batch Normalization (批量归一化)
  - High Resolution Classfier(高分辨率的分类器)
  - Convolutional With Anchor Boxes (带锚框的卷积)
  - Dimension Clusters (维度聚类)
  - Direct location prediction (直接位置预测)
  - Fine-Grained Feature (细粒度特性)
  - Multi-Scale Training (多尺度训练)
- 3. Faster(更快)
- - Darknet-19
  - Training for Classification （分类训练）
  - Training for Detection（检测训练）
- 4、Stronger （更强）
- - Hierarchical Classification （阶层式分类）
  - Dataset combination with WordTree (利用WordTree 结合资料集)
  - Joint classification and detection (联合分类及侦测演算法)
- 5、Conclution (结论)

Abstract (摘要)

本文提出的最先进的，实时目标检测系统算法是YOLO9000,可以检测超过9000个目标类别。该算法是在YOLOv1的基础上改进得到的。
YOLO9000使用一种新颖的多尺度训练方法(multi-scale training method)，相同的YOLOv2模型可以运行在不同的大小的图片上，权衡(tradeoff)速度和精度。比如在67帧率下，v2在VOC2007数据集的mAP可以达到76.8; 在40帧率下，mAP可以达到78.6。这样，v2就可以适应多种场景需求，在不需要快的时候，它可以把精度做很高，在不需要很准确的时候，它可以做到很快。
最后，我们提出了一种联合训练目标检测和分类的方法（jointly train on object detection and classification）。使用这种方法，我们在COCO检测数据集和ImageNet分类数据集上同时训练YOLO9000。

☀️ YOLOv2和YOLO9000算法在2017年CVPR上被提出，重点解决YOLOv1召回率和定位精度方面的误差。YOLOv2 是在YOLOv1的基础上改进得到，改进之处主要有：Batch Normalization (批量归一化)、High Resolution Classfier(高分辨率的分类器)、Convolutional With Anchor Boxes (带锚框的卷积)、Dimension Clusters (维度聚类)、Direct location prediction (直接位置预测)、Fine-Grained Feature (细粒度特性)、Multi-Scale Training (多尺度训练)，它的特点是“更好，更快，更强”。
YOLO9000 的主要检测网络也是YOLO v2，同时使用WordTree来混合来自不同的资源的训练数据，并使用联合优化技术同时在ImageNet和COCO数据集上进行训练，目的是利用数量较大的分类数据集来帮助训练检测模型，因此，YOLO 9000的网络结构允许实时地检测超过9000种物体分类，进一步缩小了检测数据集与分类数据集之间的大小代沟。

1. Introduction (简介)

一般用途的目标检测应快速、准确，并能够识别各种各样的目标。神经网络的引入，使得检测框架变得越来越快和准确。然而，大多数检测方法仍然局限于一小部分对象。
与分类和标记等其他任务的数据集相比，当前的目标检测数据集是有限的。最常见的检测数据集包含数千到数十万的图像，带有数十到数百个标签。分类数据集有数百万张图像，其中包含数万或数十万个类别。
然而，目标检测任务中的数据集制作要比分类任务（classification）和标签(tagging)任务要麻烦的多，因此两者的数据集在未来也很难达到相同的规模。

提出了一种新的方法来利用（harness）我们已经拥有的大量分类数据，并利用它来扩展现有检测系统的检测范围。我们的方法使用对象分类的层次视图(hierarchical view of object classification)，它允许我们将不同的数据集组合在一起。
我们还提出了一个联合训练算法（joint training algorithm），允许我们用检测和分类数据来训练目标检测器。我们的方法利用标记的检测图像来学习精确地定位目标，而使用分类图像来增加词汇量和鲁棒性。
我们利用这种方法训练YOLO9000（一个可以检测超过9000种不同的物体类别的实时物体检测器）。首先，我们对基本的YOLO检测系统进行了改进，得到了了最先进（state-of-art）的实时(real-time）探测器YOLOv2。然后利用我们的数据集组合方法( dataset combination method)和联合训练算法( dataset combination method)，对来自ImageNet的9000多个类和来自COCO的检测数据进行模型训练。
我们所有的代码和经过训练的模型都可以在http://pjreddie.com/yolo9000/网站上找到。

2. Better (更好)

与最先进的检测系统相比，YOLO有很多缺点。YOLO与Fast R-CNN的误差分析表明，YOLO的定位误差（localization errors）较大。此外，与基于区域提议的方法(region proposal network)相比，YOLO的召回率相对较低。因此，我们主要任务是在保持分类准确性的同时，提高召回率和减少定位误差。
训练更大的网络（training larger networks）或集成多个模型(ensembling multiple models)通常可以提升检测的性能。然而，对于YOLOv2，我们想要的是一种更精确、更快的检测器。因此我们简化了网络，使之更加容易学习。我们将过去工作中的各种想法与我们自己的新概念相结合，以提高YOLO的性能。结果的摘要见表2。

Batch Normalization (批量归一化)

1️⃣改进方法一：批量归一化（Batch Normalization）。
批量归一化可以显著提高收敛性(improvements in convergence)，同时消除了对其他形式的正则化(regularization)的需要。通过在YOLO中为所有的卷积层添加批量归一化，mAP提升了2%。批量规范化还有助于正则化模型（regularize the model）。批量归一化可以替代yolov1中的dropout方法来解决过拟合（overfitting）的问题。

❄️BN是什么？
批量归一化，即在卷积或池化之后，激活函数之前，对每个数据输出进行标准化，使得均值为0，方差为1。这样网络就不需要每层都去学数据的分布，收敛会更快。效果示意图如下：

❄️BN算法流程

BN 参考论文：《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》

❄️BN带来的好处
(1) 减轻了对参数初始化的依赖，利于调参。
(2) 让网络提高了收敛性。通过标准化上层输出，均衡输入数据分布，训练更快，可以使用更高的学习率（learning rate）和衰减(decay)
(3) BN一定程度上增加了泛化能力，消除了对其他形式的正则化（regularization）的依赖，代替dropout解决过拟合问题。
(4) 通过标准化输入，降低激活函数（Activation Function）在特定输入区间达到饱和状态的概率，避免梯度弥散（Gradient Vanishing）问题；

High Resolution Classfier(高分辨率的分类器)

2️⃣改进方法二：高分辨率的分类器（High resolution classifier）。
所有最先进的检测方法都使用在ImageNet上预先训练的分类器(提取浅层特征)，而非完全重新训练模型，从而提高效率。
从AlexNet开始，大多数分类器都对小于256 × 256的输入图像进行操作. YOLOv1在预训练时采用的是224*224的输入（在ImageNet数据集上进行），然后在检测的时候采用448*448的输入，这会导致从分类模型切换到检测模型的时候，模型还要适应图像分辨率的改变。
YOLOv2则将预训练分成两步：先用224*224的输入在ImageNet数据集训练分类网络，大概160个epoch（将所有训练数据循环跑160次）后将输入调整到448*448，再训练10个epoch（这两步都是在ImageNet数据集上操作）。然后利用预训练得到的模型在检测数据集上fine-tuning。这样训练得到的模型，在检测时用448*448的图像作为输入可以顺利检测。这个高分辨率的分类网络使我们的mAP增加了近4%。

☀️ fine-tuning: 用已经训练好的模型，加上自己的数据集，来训练新的模型。即使用别人的模型的前几层，来提取浅层特征，而非完全重新训练模型，从而提高效率。一般新训练模型准确率都会从很低的值开始慢慢上升，但是fine-tuning能够让我们在比较少的迭代次数之后得到一个比较好的效果。

Convolutional With Anchor Boxes (带锚框的卷积)

3️⃣改进方法三：带锚点（anchor）的卷积
YOLO在卷积特征提取器上使用全连接层直接预测检测框的坐标。Faster R-CNN是使用手工挑选的先验预测框（hand-picked prior）。在Faster R-CNN中，区域提议网络(RPN)仅使用卷积层来预测锚框的偏移量和置信度。由于预测层是卷积的，RPN预测特征图中每个位置的这些偏移量。预测偏移量而不是坐标简化了问题，并使网络更容易学习。
我们从YOLO中移除全连接层，并使用锚框来预测检测框。首先，我们去除了一个池化层，使网络的卷积层的输出具有更高的分辨率。我们还将网络缩小到416*416的分辨率大小，而不是448×448。我们这样做是因为我们想在特征图中有奇数个位置，所以只有一个中心单元格。尤其是大的物体，往往占据图像的中心，所以最好在图像中心有一个位置来预测这些物体，而不是四个位置都在附近。YOLO的卷积层对图像进行了32倍的降采样，所以通过使用416的输入图像，我们得到了13 × 13的输出特征图。
在使用锚框时，将类预测机制与空间位置解耦（decouple），预测每个锚框的类别（class）和对象(objectness)。在预测类别时使用真实框和预测框的IOU来计算；在预测对象时，当锚框内有物体时属于某种类别的条件概率。
使用锚箱时，准确性小幅下降。YOLO只预测了每张图片的98个检测框，但我们的模型预测了1000多个检测框（有更多的检测框）。在没有锚框的情况下，我们的中间模型的mAP值为69.5，召回率为81%。使用锚箱，我们的模型得到69.2个mAP，召回率为88%。尽管mAP减少了，但召回率的增加意味着我们的模型有更多的改进空间。

RPN网络一个最重要的概念就是anchor，启发了后面的SSD和YOLOv2等算法，虽然SSD算法称之为default box，也有算法叫做prior box，其实都是同一个概念，他们都是anchor的别称, 简单理解为在图像上预设好的不同大小，不同长宽比的参照框。
我们不再需要计算Haar、Hog等特征，直接让神经网络输出，
每个anchor认为自己是否含有物体的概率，物体中心点与anchor自身的中心点位置的偏移量，以及相对于anchor宽高的比例。

Dimension Clusters (维度聚类)

4️⃣改进方法四：维度聚类（Dimension Cluster）
在YOLO中使用锚框时，我们会遇到两个问题：首先，盒子尺寸是手工挑选的。即便网络可以学会适当地调整检测框，但如果我们为网络选择更好的先验框（priors），我们可以让网络更容易学习和预测。
我们没有手动选择先验框，而是在训练集的检测框上上运行k-means聚类（k-means cluster）来自动生成好的先验框。
如果我们使用带有欧几里德距离（Euclidean）的标准k-means，较大的检测框比较小的检测框产生更多的误差。然而，我们真正想要的无论检测框的大小都有较好IOU得分的先验框。因此，对于k-means算法中距离的度量，我们使用如下公式:
$d ($ box, centroid $)=1-\mathrm{IOU}($ box, centroid $)$
如下图，选取不同的k值（聚类的个数）运行k-means算法，并画出平均IOU和K值的曲线图。当k = 5时，可以很好的权衡模型复杂性和高召回率。与手工挑选的相比，k-means算法挑选的检测框形状多为瘦高型。

上表表明使用k-means来生成检测框可以使模型有更好的表示，并使任务更容易学习。

faster- rcnn 系列选择的先验框的比例都是常规的（如三个scale大小，每个大小对应三种比例1:1、1:2、2:1，一共9种先验框），并不一定完全适合数据集。Yolov2用标注的检测框进行聚类提取先验框。

Direct location prediction (直接位置预测)

5️⃣改进方法五：直接位置预测（Direct location prediction）
在使用锚框时，模型早期迭代过程中不稳定，尤其表现在预测检测框的位置坐标（x,y）。预测 (x,y) 以及 tx，ty 使用的是如下公式：
$x=\left(t_{x} * w_{a}\right)+x_{a}$
$y=\left(t_{y} * h_{a}\right)+y_{a}$

作者应该是把加号误写成了减号。anchor的预测公式来自于Faster-RCNN（原文链接）, 原文给的公式如下图：

公式中，符号的含义解释一下： $x$ 是坐标预测值， $x_a$ 是anchor坐标（预设固定值）， $x^∗$ 是坐标真实值（标注信息），其他变量 y，w，h以此类推，t 变量是偏移量。然后把前两个公式变形，就可以得到正确的公式：
$x=\left(t_{x} * w_{a}\right)+x_{a}$
$y=\left(t_{y} * h_{a}\right)+y_{a}$

这个公式是不受约束（unconstrained）的，因此任何锚框可以出现在图像中的任何位置。在随机初始化的情况下，模型需要很长时间才能稳定到预测合理的偏移量。
为了解决上述问题，我们预测相对于网格单元的位置坐标。这使得检测框的真实值落在0和1之间。我们使用逻辑激活（logistic activation）来约束网络的预测，使其落在这个范围内。

该网络预测输出特征图中每个网格单元的5个边界框。每个边界框对应的5个坐标，tx, ty, tw, th和to。如果单元格从图像的左上角偏移(cx, cy)，且之前的边界框的宽度和高度为pw, ph，则预测对应于:
$\begin{aligned} b_{x} &=\sigma\left(t_{x}\right)+c_{x} \\ b_{y} &=\sigma\left(t_{y}\right)+c_{y} \\ b_{w} &=p_{w} e^{t_{w}} \\ b_{h} &=p_{h} e^{t_{h}} \\ \operatorname{Pr}(\text { object }) * \operatorname{IOU}(b, \text { object }) &=\sigma\left(t_{o}\right) \end{aligned}$

$\sigma$ 表示的是sigmod函数，其值域在0到1之间。

由于我们约束了位置预测，使得参数更容易学习，网络更稳定。该方法使得mAP提升了5%.

Fine-Grained Feature (细粒度特性)

6️⃣ 改进方法六：细粒度特性（Fine-Grained Features）。
这个修改后的YOLO在13 × 13特征图上进行检测。虽然这对于大型对象来说已经足够了，但是对于较小的对象来说，更细粒度的特性可能会使得检测效果更好。
faster R-CNN和SSD都在网络中的各种特征图上运行他们的提议网络(proposal network)，以获得一系列的分辨率大小的特征图。我们采用了一种不同的方法，直接在YOLO的网络上添加一个直通层（passthrouth layer），融合早期26 × 26分辨率的特征图。
直通层通过将相邻的特征在不同的通道叠加，将高分辨率特征与低分辨率特征串联起来，类似于ResNet中的映射。这使得26 × 26 × 512的特征图转换成13 × 13 × 2048的特征图，可以与原始特征进行拼接。我们的检测器运行在这个扩展的特性图之上，因此它可以访问细粒度的特性。这将带来1%的性能提升。

感受野是啥？
卷积的过程就是对特征进行浓缩，浓缩后的一个点代表原始输入图片的多大区域就相当于感受野。

❔ 如果堆叠3个3*3的卷积层，并且保持滑动窗口步长为1，其感受野就是7*7的了。这跟一个使用7*7卷积核的结果是一样的，那为什么非要堆叠3个小卷积呢？

假设输入大小都是 $h * w * c$ ，并且都使用c个卷积核(得到c个特征图)，可以来计算
一下其各自所需参数

很明显，堆叠小的卷积核所需的参数更少一些，并且卷积过程越多，特征提取
也会越细致，加入的非线性变换也随着增多，还不会增大权重参数个数，这就
是VGG网络的基本出发点，用小的卷积核来完成体特征提取操作。

❄️ 最后一层时感受野太大了，小目标可能丢失了，需融合之前的特征。

其中，Passthrough Module 构造如下图所示，它将相邻的部分作为深度叠加上去，这样便能在缩小的特征途中仍然保有其细部特征。

重组层采用每个交替像素并将其放入不同的通道。让我们以 4x4 像素的单个通道为例，如下所示。重组层将大小减小到一半，并创建了 4 个通道，相邻像素位于不同的通道中。因此，来自 Conv13_512 的 Reorg 层的输出将为 2048x13x13。

Multi-Scale Training (多尺度训练)

7️⃣ 改进方法七：多尺度训练
我们希望YOLOv2能够在不同尺寸的图像上运行的结构都很稳健，采用的方法就是在训练过程中不断更改输入图像的尺寸。
由于整个模型最后输出的特征图为原尺寸的 $1 / 32$
，所以在训练过程中，让模型每训练10 epochs 就从下列几种尺寸(32倍数) 中随机选择输入尺寸 : ${320,352,....,608}$

这样的训练方式迫使模型可以在各种尺寸上都有不错的预测表现。小尺寸的输入图像，YOLOv2 可以在极短的时间内进行预测，也因此，整个模型可以轻易地在速度与精准度上进行权衡；而在高分辨度的图像上，YOLOv2 更有着极高的mAP 表现，尽管速度上稍微慢了一些，但亦有40 fps，仍可达到即时预测的要求。

3. Faster(更快)

YOLOv2的网络结构
与VGG模型类似，在YOLO种我们主要使用3 × 3过滤器（filter），并在每个池化步骤之后将通道数量增加一倍(于此同时，输出图片的分辨率减少一倍，如通过一次Maxpool之后，由14*14变为7*7)。在Network in Network (NIN)的工作之后，我们使用全局平均池化（global Avgpool）来进行预测，并使用1 × 1过滤器来压缩(compress)3 × 3卷积之间的特征表示。我们使用批量归一化（batch normalization）来稳定训练，加快收敛速度、正则化模型。

然而现今的物件侦测系统大多依赖VGG-16 作为特征提取器。VGG-16 是一个非常强大的分类器，但它的网路结构过于庞大且复杂。
YOLO 采用的是较快的GoogLeNet 架构，虽说整体mAP 表现较VGG-16 差一些，但是却换来更快速、更少的预测运算。
YOLOv2 中，使用的是一个全新的架构: Darknet-19
YOLOV2的网络结构详细版

Darknet-19

我们最后的模型叫做Darknet-19，有19个卷积层和5个最大池层。详细描述请参见下表。Darknet-19只需要55.8亿次操作就可以处理一幅图像，但在ImageNet上却能达到72.9%的前一精度和91.2%的前五精度。

☀️ Darknet 的实际输入 $416 * 416$ （上图中的224*224只是举个例子）,通过5次降采样后，输出为 $13 * 13$ ( $416/(2^5)=13$ )

Darknet 没有全连接层，但有5次降采样。为什么去掉全连接层了呢？
因为全连接层容易过拟合，训练慢。（参数太多）如下图，YOLOv1中通过全连接层将 $7 * 7 * 1024$ 的特征图变换为 $7 * 7 * 30$ 的特征图。但是这种变换完全可以通过一个 $3 * 3$ 的卷积核做到,从而节省参数。

所有卷积核的大小有两种 $3 * 3$ 和 $1 * 1$ 。为什么要选择这种大小的卷积核呢？
$3 * 3$ 的卷积核借鉴了VGG的思想: 当使用比较小的卷积核做卷积时，比较省参数，感受野大，因此训练的模型会更好。用 $1 * 1$ 卷积核来降维节省参数，训练的快。

Training for Classification （分类训练）

这部分前面有提到，就是训练处理的小trick。
这里的Training for Classification都是在 ImageNet上进行预训练。
YOLOv2的训练主要包括三个阶段：
第一阶段：在ImageNet分类数据集上从头开始预训练Darknet-19，训练160个epoch。输入图像的大小是224*224，初始学习率为0.1。另外在训练的时候采用了标准的数据增加方式比如随机裁剪，旋转以及色度，亮度的调整等。
第二阶段：将网络的输入调整为448*448，继续在ImageNet数据集上fine-tuning分类模型，训练10个epoch。参数的除了epoch和learning rate改变外，其他都没变，这里learning rate改为0.001。

Training for Detection（检测训练）

第三阶段：修改Darknet-19分类模型为检测模型，并在检测数据集上继续fine-tuning网络。
网络修改包括：移除最后一个卷积层、global avgpooling层以及softmax层，新增了三个3*3* 2014卷积层，同时增加了一个passthrough层，最后使用1*1卷积层输出预测结果。

在YOLOv1中，类别概率是由cell来预测的，一个cell对应的两个box的类别概率是一样的，但是在YOLOv2中，类别概率是属于box的，每个box对应一个类别概率，而不是由cell决定，因此这边每个box对应25个预测值（5个座标加20个类别值）

（1）YOLOv1： $S * S * (B * 5 + C) = > 7 * 7 （ 2 * 5 + 20 ）$

其中B对应Box数量，5对应边界框的定位信息（w,y,w,h）和边界框置信度（Confidience）。分辨率是7*7，每个Cell预测2个Box，这2个Box共用1套条件类别概率（1*20）。

（2）YOLOv2： $S * S * K * (5 + C) = > 13 * 13 * 5 （ 5 + 20 ）$

分辨率提升至13*13，对小目标适应性更好，借鉴了FSRCNN的思想，每个Cell对应K个Anchor box（YOLOv2中K=5，记得上文提到过聚类得到5个先验框），每个Anchor box对应1组条件类别概率（1*20）

论文里没有说明先验框匹配和loss是怎么做的，所以有很多细节可以参考 YOLO在TensorFlow上的实现darkflow（见yolov2/train.py）
接下来的损失函数和匹配原则参考这篇文章

❄️ 损失函数

（1）YOLOv2和yolov1一样，每个网格单元只选择IOU最大的先验框负责预测，计算坐标误差、置信度误差（此时target为1）以及分类误差。而其它的边界框只计算置信度误差（此时target为0）。
(2) YOLOv2和YOLOv1的损失函数一样，为均方差函数。但实现起来更为复杂。

Loss计算公式：
$\lambda_{\text {noobj }} \sum_{i=0}^{\text {l.h*l.w }} \sum_{j=0}^{\text {l.n }} 1_{i j}^{\text {noobj }}\left(C_{i}-\hat{C}_{i}\right)^{2}+\lambda_{o b j} \sum_{i=0}^{\text {l.h*l.w }} \sum_{j=0}^{l . n} 1_{i j}^{o b j}\left(C_{i}-\hat{C}_{i}\right)^{2}$
$+\lambda_{\text {class }} \sum_{i=0}^{\text {l.w*l.h }} \sum_{j=0}^{\text {l.n }} 1_{i j}^{\text {obj }} \sum_{c \in \text { classes }}\left(p_{i}(c)-\hat{p}_{i}(c)\right)^{2}$
$+\lambda_{\text {coord }} \sum_{i=0}^{\text {l.w*L.h }} \sum_{j=0}^{j . n} 1_{i j}^{o b j}\left(2-w_{i} * h_{i}\right)\left[\left(x_{i}-\hat{x}_{i}\right)^{2}+\left(y_{i}-\hat{y}_{i}\right)^{2}+\left(w_{i}-\hat{w}_{i}\right)^{2}+\left(h_{i}-\hat{h}_{i}\right)^{2}\right]$
$\sum_{i=0}^{\text {l.włl.h }} \sum_{j=0}^{j . n} 1_{i j}^{n o o b j}\left[\left(p_{j x}-\hat{x}_{i}\right)^{2}+\left(p_{j y}-\hat{y}_{i}\right)^{2}+\left(p_{j w}-\hat{w}_{i}\right)^{2}+\left(p_{j h}-\hat{h}_{i}\right)^{2}\right]$

W，H分别指的是特征图（13*13）的宽与高；
A指的是先验框数目（这里是5）；
各个λ值是各个loss的权重系数，参考YOLOv1的loss；

第一项 :计算background的置信度误差
先计算各个预测框的IOU值，并且取IOU的最大值，如果该值小于一定的阈值（YOLOv2使用的是0.6），那么这个预测框就标记为background，需要计算noobj的置信度误差；
第二项是计算先验框与预测宽的坐标误差，但是只在前12800个iterations间计算，我觉得这项应该是在训练前期使预测框快速学习到先验框的形状；
第三项计算与某个ground truth匹配的预测框各部分loss值，包括坐标误差、置信度误差以及分类误差

⛄️匹配原则

对于某个ground truth，首先要确定其中心点要落在哪个cell上，然后计算这个cell的5个先验框与ground truth的IOU值（YOLOv2中bias_match=1），计算IOU值时不考虑坐标，只考虑形状，所以先将先验框与ground truth的中心点都偏移到同一位置（原点），然后计算出对应的IOU值，IOU值最大的那个先验框与ground truth匹配，对应的预测框用来预测这个ground truth。
在计算obj置信度时，在YOLOv1中target=1，而YOLOv2增加了一个控制参数rescore，当其为1时，target取预测框与ground truth的真实IOU值。对于那些没有与ground truth匹配的先验框（与预测框对应），除去那些Max_IOU低于阈值的，其它的就全部忽略，不计算任何误差。这点在YOLOv3论文中也有相关说明：YOLO中一个ground truth只会与一个先验框匹配（IOU值最好的），对于那些IOU值超过一定阈值的先验框，其预测结果就忽略了。这和SSD与RPN网络的处理方式有很大不同，因为它们可以将一个ground truth分配给多个先验框。
尽管YOLOv2和YOLOv1计算loss处理上有不同，但都是采用均方差来计算loss。
另外需要注意的一点是，在计算boxes的和误差时，YOLOv1中采用的是平方根以降低boxes的大小对误差的影响，而YOLOv2是直接计算，但是根据ground truth的大小对权重系数进行修正：l.coord_scale * (2 - truth.w*truth.h)，这样对于尺度较小的boxes其权重系数会更大一些，起到和YOLOv1计算平方根相似的效果。

4、Stronger （更强）

Hierarchical Classification （阶层式分类）

WordNet 是一个语言库，它将名词间的关系建构起来，而ImageNet 也是参照WordNet 进行标注。然而，语言十分的复杂，每一个名词也无法单纯归在某一类别之下，如: 「狗」(dog)同时是「犬」(canine)类别以及「家畜」类别之下。也因此，WordNet 并非是一个树状结构，而是一个有向图结构(directed graph)。

作者们并不采用整个WordNet 的图结构，而是从中抽取其视觉名词重新制作一个树状结构。

每一个视觉名词都可以循着一条( 或多条) 路径到达root ( physical object物理物件)，如果每一个名词仅一条路径到达root 者便先加入树状结构中，若有多条路径则采用最短路径。依照这样的方式建构出一个WordTree，一个视觉概念的阶层式模型(Hierarchical Model)。

一旦WordTree 被建构出来，那么我们便可以计算出每一个节点之机率以及下位节点之条件机率 :

原本的Label Space 是1000 维的空间，现在引进了WordTree 后，会变成一个1369 维的空间。而前面有提到，softmax 必须要在类别互斥的前提下进行，因此在机率计算上面也要有所改变，一个节点的所有下位词都会进行一次softmax。

这样的作法，我们提高了label 维度，但准确度下降不多。再者，若我们给出一张不确定类别的图象( 一张看不出来种类的狗图片) 进行预测，可能在下位词( 各种类别的狗) 的预测机率会很低，但在上位词( 狗) 的部分可以有着较高的预测机率。

上述的分类预测上可以有着不错的预测，在物件侦测上仍然可以用这样的方式训练。

我们会给定一个阀值，首先侦测模型上会先预测
，来确认是否存在待预测的物件，之后随着WordTree 往下遍历每一个类别，并给给出每一个节点的机率，分裂时会往机率较高的节点往下走，最后给出一个高于阀值的节点类别作为预测类别。

Dataset combination with WordTree (利用WordTree 结合资料集)

我们可以使用WordTree将多个数据集以一种合理的方式组合在一起。我们只需将数据集中的类别映射到树中的synsets。图6显示了一个使用WordTree组合ImageNet和COCO标签的示例。WordNet是非常多样化的，所以我们可以对大多数数据集使用这种技术。

Joint classification and detection (联合分类及侦测演算法)

既然WordTree 可以扩展ImageNet 的标注，那么也可以用来结合不同的资料集，为了可以训练出一个大型的物件侦测系统，论文中利用WordTree 来结合COCO 资料及以及ImageNet 的前9000 个标注类别资料，这样庞大的资料集一共有9418 个类别。
由于ImageNet 相对来说比COCO 资料集大非常多，作者有针对COCO 进行Oversampling ( 超取样、过取样)，来让两者的比例接近4:1。

利用这样的资料集来对YOLOv2 进行训练，但原本选择5 个Anchor Boxes 改为3 个。

若今天模型处理「侦测样本」时，对于分类误差我们只会分配给相同级别以上的类别，举例来说，今天如果label 是「狗」，那我们便只会将分类误差往上分配，而不会配给「狗」以下的节点。这其实很直觉，因为以下的节点该怎么分类我们完全没有资讯。

若今天要处理的是「分类样本」时，我们只需要处理Loss function 中的分类误差项即可，因此，找出拥有此分类机率最高的边界框，然后在WordTree 上计算误差即可。
除此之外，论文中还给了一个条件，预测边界框必须与真实边界框有大于的IOU。
经过这样的联合训练后，YOLO9000 可以预测超过9000种物件，并且在半监督学习的条件下学习到一些成果。(我不会说它非常厉害，因为事实上它的mAP 也还不到20%)

5、Conclution (结论)

这篇论文中提出了两个即时的物件侦测系统–YOLOv2 以及YOLO9000。
YOLOv2 可以在多种尺寸图像中运行，并且在速度与精准度之间取得平衡; YOLO9000 则是提供一个即时框架，利用物件侦测及分类的联合训练演算法以及WordTree 资料集来侦测多达9000种物件。
WordTree 的概念可以让分类标注提供更大的运用空间，并且可以利用来进行弱监督学习，也可以利用这样的概念结合各种不同任务的资料集，对于分类有很大的助益。

参考
[论文] YOLO9000 : Better, Faster, Stronger 解读
YOLOv2——引入：Anchor+特征融合 (目标检测)(one-stage)(深度学习)(CVPR 2017)
深度学习中 Batch Normalization为什么效果好？

你可能感兴趣的:(计算机视觉,目标检测,深度学习)

和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
基于opencv的鱼群检测和数量统计识别鱼群密度带界面
完整项目点文末名片查看获取一、项目简介本项目旨在通过计算机视觉技术，实现对视频中鱼类数量的自动检测与计数。利用OpenCV库进行图像处理，包括背景减除、形态学操作、轮廓检测等步骤，最终在视频帧中标记出鱼类并统计其数量。该系统可广泛应用于水产养殖、生态监测等领域，有助于提高工作效率和数据准确性。二、环境准备在开始项目之前，需要确保以下环境和工具已安装：Python：推荐使用Python3.6及以上版
目标跟踪领域经典论文解析 ♢.＊目标跟踪人工智能计算机视觉
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！目标跟踪是计算机视觉领域的一个
基于均值偏移算法的动态目标跟踪研究 Zoiny_楠算法均值算法目标跟踪
摘要：目标跟踪技术是计算机视觉领域中重要研究课题之一,在人类生活、军事侦察、工业生产、医疗诊断、交通管理等多方面,都有广泛的应用,研究目标跟踪对人类生活、工程应用等具有现实的指导意义。在基于视觉的目标跟踪算法中,经典的Mean-Shift算法以其理论科学有效、操作简单易实现,跟踪性能较好等优势,一直是众多学者研究的热点。可算法也存在着许多缺陷。例如目标模型中混有背景信息的干扰,给目标定位带来了偏差
道路交通标志检测数据集-智能地图与导航交通监控与执法智慧城市交通管理-2,000 张图像 cver123 数据集智慧城市人工智能目标跟踪计算机视觉目标检测
道路交通标志检测数据集已发布目标检测数据集合集（持续更新）道路交通标志检测数据集介绍数据集概览包含类别应用场景数据样本展示YOLOv8训练实战1.环境配置安装YOLOv8官方库ultralytics2.数据准备2.1数据标注格式（YOLO）2.2文件结构示例2.3创建data.yaml配置文件3.模型训练关键参数补充说明：4.模型验证与测试4.1验证模型性能关键参数详解常用可选参数典型输出指标4.
day39 心落薄荷糖 Python训练营 python
#先继续之前的代码importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,Dataset#DataLoader是PyTorch中用于加载数据的工具fromtorchvisionimportdatasets,transforms#torchvision是一个用于计算机视觉的库，
【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测小米玄戒Andrew 图像处理：从入门到专家图像处理人工智能深度学习算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目，打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案，掌握医学图像分割的U-Net实现，设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化，帮助读者从“技术应用”迈向“系统设计”。一、项目1：图像超分辨率重建（从模糊到清晰的跨越）1.技术背景与核心指标超分辨率（SR）是通过算法将低分辨率（LR）图像恢复为高分辨率
Densenet模型花卉图像分类深度学习乐园分类数据挖掘人工智能
项目源码获取方式见文章末尾！600多个深度学习项目资料，快来加入社群一起学习吧。《------往期经典推荐------》项目名称1.【基于CNN-RNN的影像报告生成】2.【卫星图像道路检测DeepLabV3Plus模型】3.【GAN模型实现二次元头像生成】4.【CNN模型实现mnist手写数字识别】5.【fasterRCNN模型实现飞机类目标检测】6.【CNN-LSTM住宅用电量预测】7.【VG
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现1.背景介绍1.1图像处理的重要性在当今数字时代,图像处理技术在各个领域都扮演着重要角色。无论是在计算机视觉、模式识别、医学影像、遥感探测还是多媒体处理等领域,图像处理都是不可或缺的核心技术。通过对图像进行预处理、增强、分割、特征提取等操作,可以从图像中获取有价值的信息,为后续的分析和决策提供支持。1.2图像倾斜问题及其影响在实际应用中,由于
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
10个基于Python的计算机视觉实战项目云博士的AI课堂基于Python计算机视觉 python 计算机视觉机器视觉人工智能
10个基于Python的计算机视觉实战项目，涵盖多个领域和应用场景，每个项目均附有GitHub地址、概述、解决的问题及应用场景：1.PCV图像处理与计算机视觉库GitHub地址:jesolem/PCV概述:提供计算机视觉基础算法的Python实现，包括图像分割、直方图均衡化、图像增强等。解决的问题:简化图像处理流程，支持快速实现算法原型。应用场景:学术研究、教学实验、图像预处理任务。2.基于朴素贝
Pytorch模型安卓部署 python&java pytorch 人工智能 python
Pytorch是一种流行的深度学习框架，用于算法开发，而Android是一种广泛应用的操作系统，多应用于移动设备当中。目前多数的研究都是在于算法上，个人觉得把算法落地是一件很有意思的事情，因此本人准备分享一些模型落地的文章(后续可能分享微信小程序部署，PyQt部署以及exe打包，ncnn部署，tensorRT部署，MNN部署)。本篇文章主要分享Pytorch的Android端部署。看这篇文章的读者
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
后端开发实习生简历迭代的5个版本，希望能帮你找到实习今天不coding 简历实习后端 Java 大厂暑期实习
后端开发实习生简历迭代的5个版本，希望能帮你找到实习1.0研究生开学时写的第一份简历，主要是对本科做的项目的一些总结。本科主要是以深度学习的项目为主+比赛，开发的技术学的比较少，后端的项目也没有做过。但是凭此找到了一份算法的实习。当时研一还是想走算法工程师的。后面觉得自己不适合，就放弃了。2.0经历过几个月的算法实习和论文折磨之后，决定走后端开发岗了，选择Java为主语言，在B站大学做了一个项目，
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
大模型量化需要重新演唱大模型量化
大模型量化是一种优化技术，旨在减少深度学习模型的内存占用和提高推理速度，同时尽量保持模型的精度。量化通过将模型中的浮点数权重和激活值转换为较低精度的表示形式来实现这一目标。以下是关于大模型量化的详细知识：目录1.量化基础1.1量化定义1.2量化优势1.3量化挑战2.量化方法2.1量化类型2.2量化粒度2.3量化算法3.量化实践3.1量化流程3.2量化工具4.量化案例4.1BERT量化4.2GPT-
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1