TheTop1

Fast R-CNN

Abstract

提出了一种基于区域卷积网络的快速目标检测方法（Fast R-CNN）。Fast R-CNN基于之前的工作，使用深度卷积网络对object proposals进行有效分类。与之前的工作相比，Fast R-CNN采用了多项创新技术来提高训练和测试速度，同时提高检测精度。Fast R-CNN比R-CNN快9倍，在测试时快213倍，在PASCAL VOC 2012上实现了更高的mAP。与SPPnet相比，Fast R-CNN训练VGG16的速度快3倍，测试速度快10倍，更准确。Fast R-CNN使用Python和C++实现(使用caffe)，并且可以在开源MIT许可下使用：https://github.com/rbgirshick/fast-rcnn

1、Introduction

最近，深度ConvNets[14,16]显著提高了图像分类[14]和目标检测[9,19]的准确性。与图像分类相比，目标检测是一项更具挑战性的任务，需要更复杂的方法来解决。由于这种复杂性，目前的方法（例如[9,11,19,25]）在multi-stage pipelines中训练模型缓慢且inelegant。
复杂性的产生是因为检测需要精确定位对象，这带来了两个主要挑战。首先，必须处理大量候选目标位置（通常称为“proposals”）。其次，这些候选区域只提供粗略的本地化(localization)，必须加以改进才能实现精确的本地化。这些问题的解决方案往往会影响速度、准确性或简单性。
在本文中，我们简化了最先进的基于ConvNet的目标检测器的训练过程[9,11]。我们提出了一种单阶段训练算法，该算法可以联合学习对目标提议进行分类并优化其空间位置。
由此产生的方法可以训练非常深的检测网络（VGG16[20]），比R-CNN[9]快9倍，比SPPnet[11]快3倍。在运行时，检测网络以0.3秒（不包括目标提议时间）的速度处理图像，同时在PASCAL VOC 2012[7]上实现最高精度，mAP为66%（而R-CNN为62%）

1.1 R-CNN and SPPnet

基于区域的卷积网络方法（RCNN）[9]通过使用深度ConvNet对目标提议(proposals)进行分类，实现了出色的目标检测精度。然而，R-CNN有明显的缺点：

1 Training is multi-stage pipeline

R-CNN首先使用log loss微调ConvNet 目标提案。然后，它将支持向量机与ConvNet功能相匹配。这些支持向量机充当目标检测器，取代通过微调学习的softmax分类器。在第三个训练阶段，学习bounding box回归。

2 Training is expensive in space and time

对于支持向量机和bounding box回归训练，从每个图像中的每个对象建议中提取特征并写入磁盘。对于非常深的网络，如VGG16，VOC07 TranVal集的5k图像需要GPU2.5天的处理时间。这些功能需要数百GB的存储空间。

3 Object detection is slow

在测试时，从每个测试图像中的每个对象提议中提取特征。使用VGG16进行检测需要47s/图像（在GPU上）。
R-CNN的速度很慢，因为它对每个对象建议执行ConvNet前向传递，而不共享计算。空间金字塔池网络（SPPnets）[11]被提出通过共享计算来加速R-CNN。SPPnet方法为整个输入图像计算卷积特征图，然后使用从共享特征图中提取的特征向量对每个对象提议进行分类。通过将提案中的部分特征图最大化为固定大小的输出（例如6×6），为提案提取特征。将多个输出大小合并，然后像空间金字塔合并[15]中那样进行连接。SPPnet在测试时将R-CNN加速10到100倍。由于更快的提案特征提取，训练时间也减少了3倍。
SPPnet也有明显的缺点。与R-CNN一样，训练是一个多阶段的过程，包括提取特征、微调具有日志损失的网络、训练支持向量机，以及最终拟合bounding box回归器。特征也会写入磁盘。但与R-CNN不同，[11]中提出的微调算法无法更新空间金字塔池之前的卷积层。毫不奇怪，这种限制（固定卷积层）限制了非常深的网络的准确性。

1.2 Contributions

我们提出了一种新的训练算法，弥补了R-CNN和SPPnet的缺点，同时提高了它们的速度和准确性。我们称这种方法为Fast R-CNN，因为它的训练和测试速度相对较快。Fast RCNN方法有几个优点：
（1）比R-CNN、SPPnet更高的检测质量（mAP）
（2）训练是单阶段的，采用multi-task的loss
（3）训练可以更新所有网络层
（4）特征缓存不需要磁盘存储
Fast R-CNN使用Python和C++实现(使用caffe)，并且可以在开源MIT许可下使用：https://github.com/rbgirshick/fast-rcnn

2、Fast R-CNN architecture and training

图1说明了Fast R-CNN架构。Fast R-CNN网络将整个图像和一组object proposals作为输入。该网络首先通过几个卷积（conv）和最大池化层处理整个图像，以生成conv特征图。然后，对于每个目标提议，感兴趣区域（RoI）池层从特征图中提取固定长度的特征向量。每个特征向量被输入到一系列全连接（fc）的层中，这些层最终分支为两个同级输出层：一个层对K个对象类加上一个“背景”类生成softmax概率估计，另一个层为K个对象类中的每一个输出四个实数。每组4个值对其中一个K类的精确边界框位置进行编码。

2.1 The RoI pooling layer

RoI池化层使用最大池将任何有效感兴趣区域内的特征转换为具有固定空间范围H×W（例如7×7）的小特征图，其中H和W是独立于任何特定RoI的层超参数。在本文中，RoI是进入conv特征图的矩形窗口。每个RoI由一个四元组（r、c、h、w）定义，该元组指定其左上角（r、c）及其高度和宽度（h、w）。
RoI最大池化层的工作原理是将 $h\times w$ 的RoI窗口划分为近似为 $h/H \times w/W$ 的子窗口，然后将每个子窗口中的值最大化为对于的输出网格单元。池化独立应用于每个特征图纬度，如标准最大池化。RoI层至少SPPnet中使用的空间金字塔池化层的特例，其中只有一个金字塔层。我们使用[11]中给出的池化子窗口计算。

2.2 Initializing from pre-trained networks

我们使用三个预先训练好的ImageNet[4]网络进行实验，每个网络都有五个最大池层和五到十三个conv层（网络细节见第4.1节）。当一个预先训练好的网络初始化一个Fast R-CNN网络时，它会经历三次转换。
首先，将最后一个最大池化层替换为RoI池化层，该层通过将H和W设置为与网络的第一个全连接层兼容来配置(如，VGG16的H=W=7)。
其次，网络的最后一个全连接层和sofrmax层(针对1000类ImageNet进行了训练)被前面描述的两个sibling层(K+1类上的全连接层和特定类别的bounding box框回归器)替换。
第三，修改网络以获取两个数据输入：图像列表和这些图像中的ROI列表。

2.3 Fine-tuning for detection

使用反向传播训练所有网络权重是快速R-CNN的一项重要功能。首先，让我们解释为什么SPPnet无法更新空间金字塔池化层下的权重。
根本原因是，当每个训练样本（即RoI）来自不同的图像时，通过SPP层的反向传播效率非常低，这正是R-CNN和SPPnet网络的训练方式。效率低下的原因是，每个RoI可能有一个非常大的感受野，通常覆盖整个输入图像。由于前传必须处理整个感受野，训练输入很大（通常是整个图像）。
我们提出了一种更有效的训练方法，利用训练过程中的特征共享。在Fast RCNN训练中，随机梯度下降（SGD）小批量是分层采样的，首先对N幅图像进行采样，然后对每幅图像的R/N ROI进行采样。关键是，来自同一图像的ROI在向前和向后过程中共享计算和内存。使N变小可以减少小批量计算。例如，当使用N=2和R=128时，建议的训练方案比从128张不同的图像（即R-CNN和SPPnet策略）中采样一个RoI大约快64倍。
对这种策略的一个担忧是，它可能会导致训练收敛缓慢，因为来自同一图像的ROI是相关的。这种担忧似乎不是一个实际问题，我们使用比R-CNN更少的SGD迭代，在N=2和R=128时获得了良好的结果。
除了分层采样之外，Fast R-CNN还使用了一个精简的训练过程，其中有一个微调阶段，联合优化softmax分类器和bounding box回归器，而不是在三个单独的阶段训练softmax分类器、支持向量机和回归器[9,11]。该程序的组成部分（损失、小批量采样策略、通过RoI池层的反向传播以及SGD超参数）如下所述。

Multi-task loss

Fast R-CNN网络有两个同级的输出层。第一个输出离散概率分布(每个 RoI), $p=(p_{0},...,p_{K})$ ，共K+1类别。通常情况下，p是由全连接层的K+1输出上的softmax来计算的。第二个sibling层为每个以k为索引的K目标类输出bounding box回归偏移 $t^k=(t^K_{x},t^K_{y},t^K_{w},t^K_{h})$ 。我们使用[9]中给出的 $t^k$ 的参数化,其中 $t^k$ 指定了相对于目标提议的比例不变的平移和log-space高度\宽度偏移。
每一个训练的RoI都标记一个ground-truth类u和ground-truth bounding-box回归目标v。我们在每个标记的RoI上使用一个多任务损失L，联合训练分类和bounding box回归：

其中 $L_{cls}(p,u)=-log p_{u}$ 是真实类的log损失。
第二个任务损失 $L_{loc}$ 定义在一个元组上，这个元组包含u类的真实bounding box回归目标， $v=(v_{x},v_{y},v_{w},v_{h})$ ，以及u类的一个预测元组 $t^u=(t^u_{x},t^u_{y},t^u_{w},t^u_{h})$ 。Iverson bracket indicator函数 $\geqslant1]$ 表明当 $\geqslant1$ 时，值为1，否则为0。按照惯例，捕获所有的背景类被标记为u = 0。对于背景RoIs，没有ground-truth bounding box的概念，因此忽略了 $L_{loc}$ 。对于bounding box回归，我们使用loss：

smoothL1是一个平滑的L1损失，比R-CNN和SPPnet中使用的L2损失对异常值不那么敏感。当回归目标是无界的，L2loss训练可能需要仔细调整学习率，以防止梯度爆炸。上式消除了这种敏感性。
Eq1中的超参数λ控制着两个任务损失之间的平衡。我们将ground-truth回归目标 $v_{i}$ 归一化，使其均值和单位方差均为0。所有实验都使用λ=1。
我们注意到[6]使用了一个相关的损失来训练一个类无关的对象提议网络。与我们的方法不同，[6]提倡将本地化和分类分开的双网络系统。ObverFea、R-CNN和SPPnet也训练分类器和bounding-box localizers，但这些方法使用阶段式训练，我们表明这对Fast R-CNN是次优的。

Mini-batch sampling

在微调期间，每个SGD小批是从N = 2张图像构建而来的，这些图像都是均匀随机选择的(通常的做法是，我们实际上迭代了数据集的排列)。我们使用大小为128的小批量，从每幅图像中采样64个RoI。就像在[9]中一样，我们从对象提议中获取25%的roi，这些提议与groundtruth包围框有至少0.5(IoU)的重叠。这些RoIs包含用前景对象类标记的例子，如 $u\geqslant1$ ，剩下的RoIs从在间隔[0.1,0.5）内具有最大ground truth的IoU的目标提案中采样，紧随[11]。这些都是背景例子，用u=0标记。较低的阈值0.1似乎可以作为hard example mining的启发式方法。在训练过程中，图像水平翻转的概率为0.5。没有使用其他数据增强。

Back-propagation through RoI pooling layers

反向传播通过RoI池化层routes导数。为了清晰，我们假设每个小批量处理只有一幅图像(N=1),尽管扩展到N>1是简单的，因为正向传播独立处理所有图像。
设 $x_{i}\in R$ 是进入RoI池化层的第i个激活输入，设 $y_{rj}$ 是第r个RoI层的第j个输出。RoI池化层计算 $y_{rj}=x_{i*(r,j)}$ ，其中 $i*(r,j)=argmax_{i^{'}\in R(r,j)}x_{i^{'}}$ 。 $R (r, j)$ 是输出单元 $y_{rj}$ 最大池化中的子窗口的输入索引集。单个 $x_{i}$ 可以分配给几个不同的输出 $y_{rj}$ 。
RoI池化层的backwards函数通过argmax计算损失函数对每个输入变量 $x_{i}$ 的偏导数：

换句话说，对于每个小批量RoI r和每个池化输出单元 $y_{rj}$ ，如果i是通过最大池化 $y_{rj}$ 选择的argmax，则偏导数 $\frac{\partial L}{\partial y_{rj}}$ 是累积的。在反向传播中，偏导数 $\frac{\partial L}{\partial y_{rj}}$ 已经由RoI池化层顶部的层的反向函数计算出来了。

SGD hyper-parameters

用于softmax分类和bounding-box回归的全连接层分别从标准偏差为0.01和0.001的零均值高斯分布初始化。偏差被初始化为0。所有层的加权学习率为1，偏差学习率为2，整体学习率为0.001。当在VOC07或VOC12 trainval上训练时，我们运行SGD进行30k的小批量迭代，然后将学习速率降低到0.0001，并训练另一个10k的迭代。当我们在更大的数据集上训练时，我们运行SGD进行更多的迭代，如后面所述。动量为0.9，参数衰减为0.0005(在权重和偏差上)。

2.4 Scale invariance

我们探讨了两种实现尺度不变目标检测的方法。
(1)通过"brute force"学习
(2)使用图像金字塔
这些策略遵循了[11]中的两种方法。在brute force方法中，在训练和测试过程中，每幅图像都按照预先定义的像素大小进行处理。该网络必须直接从训练数据中学习尺度不变的目标检测。
相比之下，多尺度方法通过图像金字塔为网络提供了近似的尺度不变性。在测试时，使用图像金字塔对每个目标提案进行近似尺度归一化。在多尺度训练过程中，我们在每次对图像进行采样时，在[11]之后随机对金字塔尺度进行采样，作为数据增强的一种形式。由于GPU内存的限制，我们只对较小的网络进行多尺度训练。

3、Fast R-CNN detection

一旦一个Fast R-CNN网络被微调，检测就相当于运行一个前向传递(假设对象提议是预先计算的)。该网络将一个图像(或一个图像金字塔，编码为图像列表)和一个R对象提案列表作为输入来评分。在测试时，R通常在2000左右，尽管我们会考虑它更大的情况(≈45k)。当使用图像金字塔时，将每个RoI分配到尺度，使缩放后的RoI在区域[11]中最接近 $224^{2}$ 个像素。
对于每个测试RoI r，前向传递输出一个类后验概率分布p和一组相对于r的预测bounding-box偏移(K个类都有自己的精确的bounding-box预测)。我们使用估计的概率 $Pr(class=k|r)=p_{k}$ 为每个类别k的对象分配一个检测置信度r。然后我们使用R-CNN[9]的算法和设置对每个类单独执行非最大抑制。

3.1 Truncated SVD for faster detection

对于整幅图像的分类，全连接层的计算时间比卷积层的计算时间要小。相反，对于检测，需要处理的RoIs数量很大，近一半的前向时间都花在计算全连接层上(见图2)。使用truncated SVD压缩大的全连接层很容易加速。
该方法将由 $KaTeX parse error: Undefined control sequence: \timesv at position 2: u\̲t̲i̲m̲e̲s̲v̲$ 权重矩阵w参数化的层利用SVD近似分解为

在这种分解中， $U$ 是由 $W$ 的第一个 $t$ 左奇异向量组成的 $u\times t$ 矩阵， $\sum_{t}$ 是包含w的top t奇异值的 $\times t$ 对角矩阵， $V$ 是由 $W$ 的第一个t右奇异向量组成的 $u\times t$ 矩阵。Truncated SVD将参数计数从 $u v$ 减少到 $t (u + v)$ ，如果 $t$ 远小于 $m i n (u, v)$ ，这将是显著的。为了压缩网络，将W对应的单个全连接层替换为两个全连接层，它们之间没有非线性。第一个层使用权重矩阵 $\sum_{t}V^{T}$ (且无偏差)，第二个层使用 $U$ (与 $W$ 相关的原始偏差)。当roi的数量很大时，这种简单的压缩方法可以提供很好的加速。

4、Main results

三个主要结果支持了本文的贡献:
1.在VOC07,2010和2012上最先进的mAP。
2.与R-CNN和SPPnet相比，更快速的训练和测试
3.在VGG16上微调卷积层改进了mAP

4.1 Experimental setup

我们的实验使用了
三个预训练的在线ImageNet模型。第一个个来自R-CNN的CaffeNet(本质上是AlexNet)。我们也可以将这种CaffeNet模型称为S型，表示“小”。第二个网络是[3]中的VGG_CNN_M_1024,深度与S相同，但更宽。我们称这个网络模型为M，即"medium"。最后的网络是来自[20]的非常深的VGG16模型。由于该模型最大，我们称其为模型L。在本节中，所有实验均采用单尺度训练和测试(s=600,详见5.2节)。

4.2 VOC2010 and 2012 results

在这些数据集上，我们将Fast R-CNN(简称FRCN)和来自公开排行版的comp4(外部数据)track上的顶级方法进行了比较(表2，表3)。对于NUS_NIN_c2000和BabyLearning法，目前没有相关的出版物，我们也无法找到使用的卷积神经网络架构的确切消息；它们是网络内网络设计(NiN)的变体。所有其他方法都从同一个预训练的VGG15网络初始化。
Fast R-CNN在VOC12上获得了最好的结果，mAP值为65.7%(加上额外数据为68.4%)。它也比其他方法快两个数量级，这些方法都是基于"慢速"的R-CNN pipeline。在VOC10上，SegDeepM比Fast R-CNN获得更高的mAP(67.2%比66.1%)。SegDeepM在VOC12训练验证+分割标注上进行训练；目的是提高R-CNN的准确性，使用马尔可夫随机场推理的R-CNN检测和分割的O2P语义分割方法。Fast R-CNN可以替换成SegDeepM来代替R-CNN，这样可能会由更好的结果。使用大的07++12训练集(见表2标题)，Fast R-CNN的mAP增加到68.8%，超过SegDeepM。

4.3 VOC2007 results

在VOC07中，我们将Fast R-CNN与R-CNN和SPPnet进行了比较。所有方法都从同一个预先训练的VGG16网络开始，并使用bounding-box回归。VGG16 SPPnet的结果由[11]的作者计算。SPPnet在训练和测试中使用五种scales。在SPPnet上对Fast R-CNN的改进表明，尽管Fast R-CNN使用了单尺度的训练和测试，但微调卷积层在mAP上提供了很大的改进(从63.1%到66.9%)。R-CNN获得了66.0%的mAP。作为次要点，SPPnet没有在PASCAL中被标记为"困难"的例子。移除了这些例子提高了Fast R-CNN的mAP到68.1%其他所有的实验都使用"困难"的例子。

4.4 Training and testing time

快速的训练和测试时间是我们的第二个主要结果。表4比较了Fast RCNN、R-CNN和SPPnet在VOC07上的训练时间(小时)、测试速率(每幅图像秒数)和mAP。对于VGG16，Fast R-CNN在没有truncated的情况下比R-CNN处理图像快146倍，在truncated后比R-CNN处理图像快213倍。训练时间减少9倍，从84小时减少到9.5小时。与SPPnet相比，Fast RCNN对VGG15的训练快了2.7倍(9.5小时vs25.5小时)，在没有truncated SVD的情况下测试速度快了7倍，使用它测试速度则快了10倍。Fast R-CNN还消除了数百GB的磁盘存储，图为它没有缓存功能。

Truncated SVD

Truncated SVD可以减少30%以上的检测时间，mAP只下降了0.3个百分点，并且无需在模型压缩后进行额外的微调。图2展示了使用VGG16的fc6层的25088 ×4096矩阵的前1024个奇异值和4096×4096 fc7层的前256个奇异值在mAP中损耗很小的情况下减少了运行时间。如果在压缩后再次进行微调，则mAP的下降量会更小，从而可以进一步提高速度。

4.5 Which layers to fine-tune？

对于SPPnet论文[11]中考虑的不太深的网络，仅微调全连接层似乎足以获得良好的精度。我们假设这个结果不适用于非常深的网络。为了验证微调卷积层对VGG16的重要性，我们使用Fast R-CNN进行微调，但冻结十三个conv层，以便只有全连接层才能学习。这种消融模拟单尺度SPPnet训练，并将mAP从66.9%降至61.4%（表5）。这个实验验证了我们的假设：通过RoI池化层进行训练对于非常深的网络非常重要。
这是否意味着所有的conv层都需要微调？不。在较小的网络（S和M）中，我们发现conv1是通用的，与任务无关（这是一个众所周知的事实[14]）。不管是否允许conv1学习，对mAP都没有任何意义。对于VGG16，我们发现只需要更新conv3_1及以上的层（13个conv层中的9个）。这一观察结果是务实的：（1）与从conv3_1学习相比，从conv2_1更新会使训练慢1.3×（12.5小时对9.5小时）；（2）从conv1_1更新会在GPU内存上运行。从conv2_1 up学习时，mAP的差异仅为+0.3分（表5，最后一列）。本文使用VGG16微调层conv3_1及以上的所有Fast R-CNN结果；所有使用S和M模型的实验都会对conv2及以上的层进行微调。

5、Design evaluation

我们进行了实验，以了解Fast RCNN与R-CNN和SPPnet相比的速度，并评估设计决策。按照最佳实践，我们在PASCAL VOC07数据集上进行了这些实验。

5.1 Does multi-task training help？

多任务训练很方便，因为它避免了管理顺序训练任务的管道。但它也有可能改善结果，因为任务通过共享表示（ConvNet）相互影响[2]。多任务训练是否能提高快速R-CNN中的目标检测精度？为了测试这个问题，我们训练只使用公式1中分类损失 $L_{cls}$ 的基线网络（即设置λ=0）。这些基线打印在表6每组的第一列中，用于模型S、M和L。请注意，这些模型没有bounding-box回归器。接下来（每组第二列），我们选取用多任务损失（等式1，λ=1）训练的网络，但我们在测试时禁用bounding-box回归。这隔离了网络的分类精度，并允许与基线网络进行apples-to-apples的比较。
在所有三个网络中，我们观察到多任务训练相对于单独的分类训练提高了纯粹的分类准确性。从多个任务到多个学习点的持续改善。
最后，我们采用基线模型（仅使用分类损失进行训练），在边界框回归层上进行固定，并使用 $L_{loc}$ 对其进行训练，同时保持所有其他网络参数不变。每组的第三栏显示了该阶段性训练计划的结果：mAP比第一栏有所改善，但阶段性训练不如多任务训练（每组第四栏）。

5.2 Scale invariance:to brute force or finesse?

我们比较了两种实现尺度不变目标检测的策略：蛮力学习（单尺度）和图像金字塔（多尺度）。无论哪种情况，我们都将图像的比例s定义为其最短边的长度。
所有单尺度实验都使用s=600像素；对于某些图像，s可能小于600，因为我们将图像的最长边限制为1000像素，并保持图像的纵横比。选择这些值是为了在微调期间使VGG16适合GPU内存。较小的模型没有内存限制，可以受益于较大的s值；然而，为每种模型优化s并不是我们主要关心的问题。我们注意到PASCAL图像平均为384×473像素，因此单尺度设置通常会将图像的采样率提高1.6倍。因此，RoI池化层的平均有效步幅为≈ 10像素。
在多刻度设置中，我们使用[11]（s）中指定的相同五个刻度∈ {480，576，688，864，1200}）以便于与SPPnet进行比较。然而，我们将最长的一面限制在2000像素，以避免超过GPU内存。
表7显示了使用一个或五个量表进行训练和测试时的模型S和M。也许[11]中最令人惊讶的结果是，单尺度检测的性能几乎与多尺度检测一样好。我们的研究结果证实了他们的结论：深度ConvNets擅长直接学习尺度不变性。多比例尺方法只提供了mAP的少量增加，但计算时间却大大减少（表7）。在VGG16（model L）的情况下，我们仅限于根据实现细节使用单一规模。它实现了66.9%的映射，略高于R-CNN[10]报告的66.0%，尽管R-CNN使用了“无限”尺度，即每个提案都被扭曲为标准尺寸。
由于单尺度处理提供了速度和精度之间的最佳折衷，尤其是对于非常深的模型，因此本小节以外的所有实验都使用s=600像素的单尺度训练和测试。

5.3 Do we need more training data?

当提供更多训练数据时，一个好的目标检测器应该会有所改进。Zhu等人[24]发现，DPM[8]mAP在仅经过几百到几千个训练示例后就饱和了。在这里，我们用VOC12 trainval集扩充VOC07 trainval集，将图像数量大致增加三倍，达到16.5k，以评估Fast R-CNN。扩大训练集将VOC07测试的mAP从66.9%提高到70.0%（表1）。在这个数据集上进行训练时，我们使用60k小批量迭代，而不是40k。
我们对VOC10和2012进行了类似的实验，为此我们从VOC07 TranVal、test和VOC12 TranVal的联合中构建了一个包含21.5k图像的数据集。在这个数据集上进行训练时，我们使用100k SGD迭代，每40k次（而不是每30k次）学习率降低0.1倍。对于VOC10和2012，mAP分别从66.1%提高到68.8%和65.7%提高到68.4%。

5.4 Do SVMs outperform softmax?

Fast R-CNN使用在微调过程中学习的softmax分类器，而不是像R-CNN和SPPnet中所做的那样，在事后训练一个或多个线性支持向量机。为了了解这种选择的影响，我们在Fast R-CNN中实施了带有hard negative挖掘的事后SVM训练。我们使用与R-CNN相同的训练算法和超参数
表8显示，softmax在所有三个网络中的表现都略优于SVM，在+0.1到+0.8个mAP点之间。这种影响很小，但它表明，与以前的多阶段训练方法相比，“一次性”微调是足够的。我们注意到，softmax与one-vs-rest支持向量机不同，在获得RoI时引入了类之间的竞争。

5.5 Are more proposals always better?

有（大致上）两种类型的对象检测器：使用稀疏对象集的检测器（例如选择性搜索[21]）和使用密集对象集的检测器（例如DPM[8]）。对稀疏提议进行分类是一种级联[22]，在这种级联中，提议机制首先拒绝大量候选项，留下一个小的分类器集进行评估。当应用于DPM检测时，这种级联提高了检测精度[21]。我们发现证据表明，proposal分类器级联也提高了Fast R-CNN的准确性。
使用选择性搜索的质量模式，我们从每幅图像1k扫描到10k提案，每次重新训练和重新测试模型M。如果提案仅起计算作用，增加每幅图像的提案数量不应损害mAP。
我们发现，随着提案数量的增加，mAP先上升，然后略有下降（图3，蓝色实线）。这个实验表明，用更多的建议淹没深层分类器无助于，甚至会略微损害准确性。
如果不进行实验，这个结果很难预测。测量对象提议质量的最新技术是平均召回率（AR）[12]。对于使用R-CNN的几种提案方法，当使用固定数量的提案时，AR与mAP具有很好的相关性。图3显示，AR（实心红线）与mAP没有很好的相关性，因为每个图像的提案数量是不同的。AR必须小心使用；更多提案导致的AR增加并不意味着mAP将增加。幸运的是，使用model M进行训练和测试所需时间不到2.5小时。因此，Fast R-CNN能够高效、直接地评估对象建议mAP，这比代理度量更可取。
我们还研究了Fast R-CNN在使用密集生成的框（过比例、位置和纵横比）时的速度，约为45k框/图像。这个稠密集足够丰富，当每个选择性搜索框被最近的（IoU中的）稠密框替换时，mAP仅下降1点（至57.7%，图3，蓝色三角形）。
密集搜索框的统计数据与选择性搜索框的统计数据不同。从2k个选择性搜索框开始，我们在添加1000个×{2,4,6,8,10,32,45}密集框的随机样本时测试mAP。对于每个实验，我们都会重新训练和测试模型M。当添加这些密集的搜索框时，mAP的下降幅度比添加更多选择性搜索框时更大，最终达到53.0%
我们还只使用密集盒（45k/图像）训练和测试Fast R-CNN。此设置生成52.9%（蓝色钻石）的地图。最后，我们检查是否需要具有hard negative挖掘的支持向量机来处理密集盒分布。支持向量机表现更差：49.3%（蓝色圆圈）。

5.6 Preliminary MS COCO result

我们将Fast R-CNN（带有VGG16）应用于MS COCO数据集[18]，以建立初步基线。我们在80k图像训练集上训练240k次迭代，并使用评估服务器在“测试开发”集上进行评估。PASCAL格式的mAP为35.9%，新的COCO格式AP平均也超过了IoU阈值，为19.7%

6.Conclusion

本文提出了Fast R-CNN，它是对R-CNN和SPPnet的一个干净、快速的更新。除了报告最新检测结果外，我们还提供了详细的实验，希望能提供新的见解。特别值得注意的是，稀疏对象方案似乎可以提高探测器的质量。在过去，这个问题的调查成本（时间）太高，但在Fast R-CNN中变得实用。当然，可能存在一些尚未被发现的技术，可以让密集的boxes和稀疏的提议一样发挥作用。如果开发出这种方法，可能有助于进一步加速目标检测。

你可能感兴趣的:(#,Mask,R-CNN,实例分割,r语言,cnn,开发语言)

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
Python：操作 Word 对齐方式 Thomas Kant Python python word c#
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Python：操作Word对齐方式详解（左对齐/右对齐/居中/两端对齐）在日常办公自动化中，我们经常需要对Word文档中的段落设置对齐方式，如左对齐、右对齐、居中、两端对齐等。本文将带你使用python-docx库
TestCafe ➜ Playwright fixture 架构迁移指南 Thomas Kant 自动化测试 playwright testcafe typescript 测试架构
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】
目前主流图像分类模型的详细对比分析 @comefly 闲聊 linux 运维服务器
以下是目前主流图像分类模型的详细对比分析，结合性能、架构特点及应用场景进行整理：一、主流模型架构分类与定量对比模型名称架构类型核心特点ImageNetTop-1准确率参数量（百万）计算效率典型应用场景ResNetCNN残差连接解决梯度消失，支持超深网络（如ResNet-152）76.1%25.6中等通用分类、目标检测ViTTransformer将图像分割为patches，用标准Transforme
【数据分析】多数据集网络分析：探索健康与退休研究中的变量关系生信学习者1 数据分析 (2025版)数据分析 r语言数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理函数网络分析画图保存图片总结系统信息介绍在医学和社会科学研究中，理解多个变量之间的复杂关系对于揭示潜在的病理生理机制和社会行为模式至关重要。本文介绍了一种基于R语言的网络分析方法，用于探索HRS（健康与退休研究）及其类似研究（CHARLS、ELSA、MHAS、SHARE）中的变
国产替代Spring Boot框架的最佳之选——Solon 遇码开发工具 spring boot 后端 java solon
Java很好。SpringBoot也很好。有没有可以与SpringBoot对标的国产框架？请你记住，它叫Solon。本文推荐Solon，是因为我自己的一段经历。我主要使用的开发语言是Python，本着技多不压身的伟大指导思想，很早就想要征服SpringBoot，无奈尝试多次始终不得其要领，也就草草收场。前段时间因为项目需要，偶然了解到Solon，不仅可以平替SpringBoot，还是国产，还有我喜
Github 2025-01-07Python开源项目日报 Top10 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-01-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目10TypeScript项目1C++项目1OpenHands:人工智能驱动的软件开发代理平台创建周期：195天开发语言：Python协议类型：MITLicenseStar数量：31753个Fork数量：3660次关注人数：31753人
python——struct模块稚与 Python python 数据分析
文章目录structmodule简介常用函数常见format解析MINSTstructmodule最近在学CNN，想找一个合适的数据集，就想到了MINST。但是官网中挂出的文件是train-images-idx3-ubyte.gz等解压后为idx3-ubyte后缀文件。后缀名中idx3表示3维的数据。简介struct模块用于二进制和常用数据类型之间的互相转化，此模块中大部分函数接受一个实现了Buf
街道垃圾识别难？陌讯视觉算法实测准确率突破95% 2501_92487900 算法边缘计算目标检测视觉检测计算机视觉
开篇痛点：街道垃圾识别的技术挑战在智慧城市和环保监管场景中，街道垃圾的实时检测一直是个难题。传统视觉算法（如YOLOv5、FasterR-CNN）在复杂街道场景下表现不佳，主要面临以下问题：光照干扰：早晚光线变化导致误检（如阴影被识别为垃圾）小目标漏检：饮料瓶、烟头等小物体在640x640输入下仅占10x10像素遮挡问题：垃圾桶周边堆积物造成特征混淆某环保科技公司实测数据显示，开源模型在真实场景中
FasterRCNN源码解析（一）-——跑通代码_霹雳巴拉wz的代码看不懂 2401_84140023 2024年程序员学习运维 linux 面试
为了做好运维面试路上的助攻手，特整理了上百道【运维技术栈面试题集锦】，让你面试不慌心不跳，高薪offer怀里抱！这次整理的面试题，小到shell、MySQL，大到K8s等云原生技术栈，不仅适合运维新人入行面试需要，还适用于想提升进阶跳槽加薪的运维朋友。本份面试集锦涵盖了174道运维工程师面试题128道k8s面试题108道shell脚本面试题200道Linux面试题51道docker面试题35道Je
【零基础学AI】第31讲：目标检测 - YOLO算法 1989 0基础学AI 人工智能目标检测 YOLO rnn lstm tensorflow
本节课你将学到YOLO算法的核心思想和工作原理如何使用YOLO进行物体检测构建一个简单的物体检测系统开始之前环境要求Python3.8+需要安装的包：opencv-python,numpy,matplotlib硬件要求：推荐使用GPU（非必须）前置知识基本Python编程能力了解卷积神经网络（CNN）的基本概念（第24讲内容）核心概念什么是目标检测？目标检测就像教计算机"看"图片中的物体。它不仅要
中药细粒度图像分类小lo想吃棒棒糖分类数据挖掘人工智能
在细粒度图像分类（FGVC）领域，BilinearCNN（BCNN）模型因其能够捕捉图像中的局部特征交互而受到广泛关注。该模型通过双线性池化操作将两个不同CNN提取的特征进行外积运算，从而获得更加丰富的特征表示，这对于区分外观相似但属于不同子类别的物体尤其有效。然而，BCNN通常计算成本较高，限制了其在移动设备或资源受限环境下的应用。为了实现轻量化并保持高精度的细粒度分类，可以考虑将MobileN
Embabel：下一代企业级JVM AI智能体框架的革命引言：AI时代的Java生态新机遇 DZSpace 软件开发 jvm 人工智能 java
在生成式AI（如ChatGPT、Claude、Gemini）席卷全球的背景下，Python凭借其丰富的AI工具链（如PyTorch、LangChain）成为主流开发语言。然而，在企业级软件开发领域，Java和JVM生态（如Kotlin、Scala）长期以来占据主导地位，尤其是在金融、电信、电商等对稳定性、可扩展性、事务管理要求极高的场景。RodJohnson（Spring框架创始人）敏锐地发现了这
【第三章:神经网络原理详解与Pytorch入门】02.深度学习框架PyTorch入门-(4)Pytorch实战 IT古董人工智能课程深度学习神经网络 pytorch
第三章:神经网络原理详解与Pytorch入门第二部分：深度学习框架PyTorch入门第四节：Pytorch模型构建内容：如何搭建复杂网络以及如何修改模型与保存一、构建复杂神经网络结构在PyTorch中，构建复杂模型通常通过继承nn.Module类，分模块组织层与前向传播逻辑。示例：自定义一个卷积神经网络（CNN）importtorch.nnasnnimporttorch.nn.functional
Transformer、BERT等模型原理与应用案例程序猿全栈の董（董翔）人工智能热门技术领域 transformer bert 深度学习
Transformer、BERT等模型原理与应用案例Transformer模型原理Transformer是一种基于注意力机制的深度学习模型架构，由Vaswani等人在2017年的论文"AttentionIsAllYouNeed"中提出。与传统的循环神经网络(RNN)和卷积神经网络(CNN)不同，Transformer完全依赖自注意力机制来处理输入序列的全局依赖关系。核心组件多头自注意力机制(Mul
大模型卷积神经网络（CNN）的架构原理 hao_wujing cnn 架构人工智能
大家读完觉得有帮助记得关注和点赞！！！一、卷积神经网络（CNN）的核心原理与架构CNN是一种专为结构化数据（如图像、文本）设计的深度学习模型，其核心在于层次化特征提取与参数高效共享，使其成为大模型中视觉和多模态任务的基础组件。1.核心结构分层解析输入层接收预处理后的数据（如图像去均值、归一化），为后续卷积操作提供标准化输入39。卷积层（核心）局部感知：每个卷积核（如3×3）仅处理输入数据的局部区域
时尚搭配助手，深度解析用Keras构建智能穿搭推荐系统忆愿高质量领域文章 keras 人工智能深度学习机器学习 python
文章目录引言：当算法遇见时尚第一章数据工程：时尚系统的基石1.1数据获取的多元化途径1.2数据预处理全流程1.2.1图像标准化与增强1.2.2多模态数据处理第二章模型架构设计：从分类到推荐2.1基础CNN模型（图像分类）2.2多任务学习模型（属性联合预测）第三章推荐算法核心3.1协同过滤与内容推荐的融合第四章系统优化4.1注意力机制应用第五章实战演练5.2实时推荐API实现第六章前沿探索：时尚AI
Spring AI 教程（一）概述 PG Thinker Spring AI Spring ChatGPT 人工智能 spring java Spring AI
前言我在23年11月那会儿关注了SpringAI项目，当时我恰好正热衷于大语言模型的开发，然而当时主流的开发语言只有Python，Java生态中并没有强大的框架供我们使用。我当时也是靠一些封装OpenAI接口的SDK包来玩ChatGPT的，但是整体的体验较差。好在我通过一些技术交流群了解了一个正在处于实验阶段的项目：SpringAI。于是果断前往它的Github仓库进行学习，而我也恰好见证了S
R语言舆情监控与可视化统计 q56731523 r语言开发语言爬虫
用R语言进行舆情监控并且做到可视化，对我来说，总体难度还算可以，主要是舆情监控通常涉及文本数据的收集（如社交媒体、新闻评论），然后进行情感分析，最后通过图表展示结果。步骤看似简单实则一点也不简单。以下就是我使用R语言进行舆情监控和可视化统计的完整示例。该方案包括文本情感分析和时间趋势可视化：#加载必要的包library(tidyverse)#数据处理和可视化library(tidytext)#文本
torch 填充补齐 AI算法网奇 python宝典 python
目录行填充补齐1.填充长度（Padding）2.掩码（Masking）3.排序优化（可选）行填充补齐importtorchfromtorch.nn.utils.rnnimportpad_sequence#原始序列（每个序列是二维张量，行数不同）batch_data=[torch.tensor([[1,2,3]])#1行#torch.tensor([[4,5,6],[7,8,9]]),#2行#tor
R 语言数据框连接操作详解：join 与 merge 方法对比晚风keeper r语言开发语言学习笔记学习方法
在数据分析工作中，我们经常需要将多个数据集按照某些条件进行合并。R语言提供了多种数据框连接方法，本文将详细介绍如何使用dplyr包的join系列函数和基础R的merge函数进行数据框的各种连接操作，并对比它们之间的差异。一、数据框连接操作概述数据框连接是将两个或多个数据框按照某些共同的列或条件组合成一个新的数据框的过程。常见的连接类型包括：左连接（LeftJoin）：保留左数据框的所有行，匹配右数
Readr 项目安装与配置指南芮奕滢Kirby
Readr项目安装与配置指南readr项目地址:https://gitcode.com/gh_mirrors/rea/readr1.项目基础介绍readr是一个R语言的开源项目，由HadleyWickham创建和维护。该项目的主要目的是提供一种快速且友好的方式来读取分隔文件（如CSV和TSV）中的矩形数据。readr能够解析多种数据类型，并在解析过程中提供详细的错误报告，以便用户能够快速识别和解决
ResNet：深度卷积神经网络的里程碑心想事“程” 小知识点 cnn 人工智能神经网络
一、引言在深度学习的发展历程中，深度卷积神经网络（CNN）不断演进，旨在提升对图像等数据的特征提取与分类能力。然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。2015年，由微软研究院提出的ResNet（ResidualNetworks，残差网络）横空出世，它以独特的残差学习思想，成功攻克了这些难题，在ImageNet竞赛中大放异彩，开创了深度神经网
视觉算法之卷积神经网络清风AI 深度学习算法详解及代码复现计算机视觉 cnn 神经网络深度学习 python 课程设计毕业设计
定义与特点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理具有网格结构的数据而设计的深度学习模型。其独特的结构和功能使其在图像处理、语音识别等领域展现出卓越的性能:CNN的核心设计理念源于对生物视觉系统的模仿。通过模拟大脑皮层中视网膜和视觉皮层的层次化结构,CNN能够有效地捕捉图像中的局部特征并逐步抽象为高层语义信息。这种设计使得CNN特别擅长处理图像和音
卷积神经网络架构的演进：从AlexNet到EfficientNet t0_54manong 大数据与人工智能 cnn 架构人工智能个人开发
在过去的8.5年里，深度学习取得了飞速的进步。回溯到2012年，AlexNet在ImageNet上的Top-1准确率仅为63.3%，而如今，借助EfficientNet架构和师生训练法，我们已经能达到超过90%的准确率。本文将聚焦于卷积神经网络（CNN）架构的演变，深入探究其背后的基本原理。一些关键术语在深入了解各种架构之前，我们需要明确几个关键术语。更宽的网络意味着卷积层中有更多的特征图（滤波器
UmiJs+react-web3连接Metamask钱包
本人是步入Web3两个月的小菜鸟，经历了一个月react的后台项目开发，此文章适合刚进入区块链行业的前端同学使用(掌握html、js、css)，还请大佬们轻点！！需求：添加Metamask插件实现点击按钮->链接钱包，并在刷新时自动链接。实现点击按钮->添加Chain节点。实现点击按钮->切换Ethereum/Rinkeby节点，切换时页面将刷新。实现点击按钮->获取账户余额。实现点击按钮->获取
【机器学习】解密计算机视觉：CNN、目标检测与图像识别核心技术（第25天）吴师兄大模型 0基础实现机器学习入门到精通机器学习计算机视觉 cnn 人工智能目标检测图像识别 pytorch
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在