魏晓蕾

AlexNet: ImageNet Classification with Deep Convolutional Neural Networks (2012) 全文翻译

作者：Alex Krizhevsky, Ilya Sutskever, and Geoffrey E. Hinton

摘要

我们训练了一个比较大的深度卷积神经网络对ImageNet LSVRC-2010图像分类比赛中的120万张高分辨率图像分成1000个不同的类别。在测试数据上，我们分别获得了top-1错误率37.5%和top-5错误率17%的结果，比以前的最好技术要好得多。该网络有6000万参数和65万个神经元，包括5个卷积层，一些卷积层后连接着最大池化层，之后是3个全连接层，最后是一个1000分类的softmax层。为了使训练更快，我们使用非饱和神经元和卷积操作的一个非常高效的GPU实现。为了减少全连接层的过拟合现象，我们应用了最近提出的“dropout”方法，这证明是非常高效的，我们也在ILSVRC-2012比赛中加入了这个模型的一个变体，获得了top-5测试错误率15.3%的结果，而第二名获得了26.2%的top-5错误率。

1. 序幕

四年之前，Yann LeCun和他的同事的论文被顶级计算机视觉会议拒绝，因为该论文使用了神经网络，然而不能明确阐述如何设计一个视觉系统。那个时候，绝大多数计算机视觉研究者认为，一个视觉系统需要通过对任务本质的透彻理解来细致地手绘，他们认为将自然图像中的物体分类的任务永远不会通过仅仅展示图像样本和物体的名字来解决，而他们的神经网络却从训练数据中获得了所有知识。
计算机视觉研究界中的许多人没有意识到的是，了解领域知识的程序员精心设计的方法无法扩展，用功能强大的通用学习程序代替程序员的方法也无法扩展。有了足够的计算量和足够的数据，学习方式才能胜过对复杂任务的手动编程，而这些复杂任务需要集成各种各样的东西。
四年前，当我们在多伦多大学学习时，我们称为SuperVision的深度神经网络几乎将识别自然图像中的物体的错误率降低了一半，并将计算机视觉领域的一些过去的模型迁移到我们的模型上。
图4显示了SuperVision可以做的一些示例。
SuperVision是从1980年代广泛研究的多层神经网络发展而来的。这些网络使用了多层特征检测器，这些特征检测器都是从训练数据中学到的。神经科学家和心理学家曾假设，这种特征检测器的层次结构将提供识别对象的可靠方法，但他们不知道如何学习这种层次结构。1980年代，几个不同的研究小组发现，可以使用称为反向传播的相对简单的算法为每幅图像高效地训练多层特征检测器，以针对每幅图像计算整个网络的分类性能所依赖的每个连接的权重值，这一事件在当时引起了极大的兴奋。
反向传播可以很好地完成各种任务，但是在1980年代，它并没有达到其倡导者的很高期望。特别是，事实证明，学习具有多层结构的网络非常困难，而这些正是最应该给人深刻印象的网络。许多研究人员错误地得出结论，从随机初始权重学习深度神经网络实在太困难了。二十年后，我们知道出了什么问题：要使深度神经网络大放异彩，它们需要更多的带标签数据和更多的计算量。

2. 引言

当前的物体识别方法主要使用机器学习方法。为了提高其性能，我们可以收集更大的数据集，学习更强大的模型，并使用更好的技术来防止过拟合。直到最近，带标签图像的数据集还相对较小——约数万个图像（例如，NORB，Caltech-101/256 和 CIFAR-10/100）。使用这种大小的数据集可以很好地解决简单的识别任务，特别是如果使用保留标签的转换来增强它们的话。例如，MNIST数字识别任务上的当前最佳错误率（<0.3％）接近人类的表现。但是现实环境中的物体表现出相当大的可变性，因此要学会识别它们，有必要使用更大的训练集。实际上，小图像数据集的缺点已得到广泛认可，但是直到最近收集带有数百万个图像标记的数据集才变得可能。新的更大数据集包括LabelMe和ImageNet，LabelMe由成千上万个完全分割的图像组成，ImageNet由1500万个带标签的高分辨率图像组成，这些图像包含22,000多个类别。
要从数百万个图像中学习数千个物体，我们需要一个具有较大学习能力的模型。然而，物体识别任务的巨大复杂性意味着，即使像ImageNet这样大的数据集也无法分类此问题，因此我们的模型还应该具有很多先验知识，以弥补我们所没有的数据。卷积神经网络就是这样的模型。可以通过改变其深度和宽度来控制卷积神经网络的性能，并且它们还对图像的性质（即统计的平稳性和像素的局部性）做出了强烈且几乎正确的假设。因此，相较于具有相似大小的层的标准前馈神经网络，CNN的连接和参数要少得多，因此更易于训练，而其理论上的最佳性能可能只会稍差一些。尽管CNN具有吸引人的特性，并且尽管其局部架构相对有效，但将它们大规模应用于高分辨率图像仍然非常昂贵。幸运的是，当前的GPU与高度优化的2D卷积实现相结合，功能强大到足以训练相当大型的CNN，而最近的数据集（如ImageNet）包含足够多的带标签样本，可以用来训练此类模型而不会出现严重的过拟合。
本文的具体贡献如下：我们在ImageNet大规模视觉识别挑战赛（ILSVRC-2010）和（ILSVRC-2012）竞赛中使用的ImageNet子集上训练了迄今为止最大的CNN之一，到目前为止，在这些数据集上取得了迄今为止最好的结果。我们编写了高度优化的2D卷积GPU实现，以及训练CNN所该有的所有其他操作，我们将这些实现公开提供。我们的网络包含许多新的和特殊的功能，这些功能可改善其性能并减少训练时间，有关详细信息，请参见第4部分。即使有120万个带有标签的训练样本，我们的网络仍然存在过拟合问题，我们采用了一些高效的技术来解决这个问题，这将在第5节中进行介绍。我们的最终网络包含五个卷积层和三个全连接层，这个深度很重要：我们发现删除了任何卷积层（每个卷积层中有不超过1％的模型参数）将导致性能降低。
最后，网络的大小主要受限于当前GPU可用内存的大小以及我们能够接受的训练时间的长短。我们的网络在两个GTX 580 3GB GPU上需要5到6天的训练时间。我们所有的实验都表明，只需要更快的GPU和更大的数据集就可以改善我们的结果。

3. 数据集

ImageNet是一个包括超过1500万张带标签的高分辨率图像的数据集，这些图像大约属于22,000个类别。这些图像是从网上收集的，并由人工标注者使用亚马逊的Mechanical Turk crowd-sourcing工具进行标注。从2010年开始，作为Pascal视觉对象挑战赛的一部分，每年举行一次名为ImageNet大规模视觉识别挑战赛（ILSVRC）。ILSVRC使用ImageNet的子集，在1000个类别中的每个类别中大约包含1000张图像。总共大约有120万张训练图像，50,000张验证图像和150,000张测试图像。
ILSVRC-2010是ILSVRC唯一拥有测试集标签的版本，因此这也是我们进行绝大部分实验的版本。由于我们也在ILSVRC-2012竞赛中输入了我们的模型，因此在第7节中，我们也报告了该版本数据集的结果，这些数据集没有测试集标签。在ImageNet上，通常报告两个错误率：top-1和top-5，其中top-5错误率是测试图像中正确的标签不在模型认为最可能的五个标签中的比例。
ImageNet由可变分辨率的图像组成，而我们的系统需要恒定的输入大小。因此，我们将图像下采样为256×256的固定分辨率。给定一个矩形图像，我们首先对图像进行缩放，以使较短的一边的长度为256，然后从生成的图像中裁剪出中心的256×256的块。除了从每个像素中减去训练样本的平均值以外，我们没有用其他任何方式对图像进行预处理。因此，我们用像素的原始RGB值训练了我们的网络。

4. 体系结构

我们网络的体系结构如图2所示。它包含8个可学习的层，5个卷积层和3个全连接层。下面，我们描述网络架构的一些新颖或不寻常的功能。根据我们对它们的重要性的估计，对第4.1–4.4节进行了排序，其中最重要的是第一个。

4.1 ReLU非线性激活函数

根据输入 $x$ 来模拟神经元输出 $f$ 的标准方法是 $f(x)=\tanh(x)$ 或 $f(x)=(1+e^{-x})^{-1}$ 。就梯度下降的训练时间而言，这些饱和的非线性函数要比非饱和的非线性函数 $f (x) = m a x (0, x)$ 慢得多。在Nair和Hinton之后，我们将具有这种非线性的神经元称为整流线性单位（ReLUs）。具有ReLU单元的深层卷积神经网络的训练速度比具有 $\tan h$ 单元的相同卷积神经网络快几倍。这在图1中得到了证明，图1显示了对于特定的四层卷积网络，在CIFAR-10数据集上达到25％的训练误差所需的迭代次数。该图表明，如果使用传统的饱和神经元模型，我们将无法使用如此大型的神经网络进行这项工作。
我们不是第一个在CNN中考虑替代传统神经元模型的人。例如，Jarrett 等人声称，非线性函数 $f (x) = ∣ t a n h (x) ∣$ 在其相应的归一化以及随后在Caltech-101数据集上进行的局部平均池化下特别有效。但是，在CIFAR-10数据集上，主要的问题是防止过拟合，因此，他们所观察到的效果与我们使用ReLU时达到同样效果所需训练的速度不同。更快的学习速度对在大型数据集上训练大型模型的性能有很大影响。

图1 具有ReLUs的四层卷积神经网络（实线）在CIFAR-10上达到25％的训练错误率，比具有tanh神经元的等效网络（虚线）快六倍。每个网络的学习率是独立选择的，以使训练尽可能快。没有使用任何形式的正则化。此处显示的效果随网络体系结构而异，但是具有ReLU的网络始终比饱和神经元的等效网络学习速度快几倍

4.2 在多块GPU上进行训练

单个GTX 580 GPU仅具有3GB内存，这限制了可以在其上训练的网络的最大大小。事实证明，120万个训练样本足以训练因为太大而无法安装在一个GPU上的网络。因此，我们将网络分布在两个GPU上。当前的GPU特别适合跨GPU并行化，因为它们能够直接读取和写入彼此的内存，而无需通过主机内存。实际上，我们采用的并行化方案将每个特征图的一半（或神经元）放在每个GPU上，还有另外一个技巧：GPU仅在某些层进行通信。这意味着，例如，第3层的特征图从第2层的所有特征图中获取输入。但是，第4层的特征图仅从第3层中位于同一GPU上的那些特征图中获取输入。选择连接模式是交叉验证的一个问题，但这使我们可以精确地调整通信量，直到每个GPU的计算量都可以接受。
所得的体系结构与Ciresan等人使用的“ columnar” CNN的体系结构有些相似，不同之处在于我们的GPU不是独立的（参见图2）。与在一个GPU上训练的每个卷积层中卷积核数量减少一半的网络相比，该方案分别将我们的top-1和top-5错误率降低了1.7％和1.2％。两个GPU网络的训练时间比一个GPU网络少。
（在最终的卷积层中，一个GPU网络实际上具有与两个GPU网络相同的卷积核数量。这是因为大多数网络的参数都在第一个全连接层中，该层将最后一个卷积层作为输入。因此，为了使两个网络具有大致相同数量的参数，我们没有将最终卷积层的大小减半（也没有将随后的全连接层的大小减半）。因此，我们比较偏向于使用两个独立的GPU网络，因为每个GPU网络比两个GPU网络的“一半”大。）

4.3 局部响应归一化

ReLU具有理想的特性，该函数不需要输入归一化即可防止饱和。如果一些训练样本对ReLU产生了正向的输入，那么该神经元就会进行学习。但是，我们仍然发现以下局部归一化方案有助于泛化。用 $a_{x,y}^i$ 表示神经元的值，该值是通过在位置 $(x, y)$ 处应用卷积核 $i$ ，然后再应用ReLU非线性函数来计算的，该响应归一化的值 $b_{x,y}^i$ 由以下表达式给出
$b_{x,y}^i=a_{x,y}^i/(k+\alpha\sum_{j=\max(0, i-n/2)}^{\min(N-1, i+n/2)}(a_{x,y}^j)^2)^\beta$
其中，在相同的空间位置上遍历n个相邻的特征图并求和，而N是该层中卷积核数。特征图的顺序当然是任意的，并且在训练开始之前确定。这种响应归一化实现了一种由实际神经元中发生的类型激发的横向抑制形式，从而在使用不同卷积核计算的神经元输出中竞争大值。常数 $k$ ， $n$ ， $\alpha$ 和 $\beta$ 是超参数，其值是使用验证集确定的；我们使用 $k = 2$ ， $n = 5$ ， $\alpha= 10^{-4}$ ， $β = 0.75$ 。在某些层中应用ReLU非线性函数之后，我们应用了局部响应归一化（请参见第4.5节）。
该方案与Jarrett等人的局部归一化方案有些相似，但由于我们不减去平均值，因此我们将其称为“亮度归一化”。响应归一化使我们的top-1和top-5错误率分别降低了1.4％和1.2％。我们还在CIFAR-10数据集上验证了该方案的有效性：四层CNN在未进行归一化的情况下实现了13％的测试错误率，在进行归一化的情况下实现了11％的测试错误率。
（由于空间限制，我们无法详细描述此网络，但是在以下文件提供的代码和参数中精确地描述了该网络：http://code.google.com/p/cuda-convnet/。）

4.4 池化层

CNN中的池化层汇总了同一特征图中的同组神经元的输出。通常，由相邻池化单元得到的邻域不重叠（例如，参考文献5、13、20）。更准确地说，可以将池化层视为由间隔为s个像素的池化单元的网格组成，每个网格都汇总了以池化单元的位置为中心的大小为z×z的邻域。如果设置s = z，我们将获得CNN中常用的局部池化层。如果设置s < z，则获得重叠池化层。这是我们在整个网络中使用的值，其中s = 2，z =3。与非重叠方案s = 2，z = 2相比，该方案分别将top-1和top-5的错误率降低了0.4％和0.3％，而这两种方案产生相同的输出维度。我们通常会在训练过程中观察到，具有重叠池化层的模型更不容易发生过拟合。

图2. CNN架构的图示，明确展示了两个GPU之间的职责划分。一个GPU在图的顶部运行一部分卷积网络，而另一个GPU在图的底部运行一部分卷积网络。GPU仅在某些层之间进行通信。网络的输入为150528维，网络其余层的神经元数量为290400–186624–64896–64896–43264–4096–4096-1000

4.5 整体架构

现在，我们准备描述CNN的总体架构。如图2所示，该网络包含8个带权重的层。前五个是卷积层，其余三个是全连接层。最后一个全连接层的输出被送到1000路的softmax，后者在1000类标签上进行分类。我们的网络将多项式逻辑回归目标最大化，这等效于在预测类别下最大化训练样本的正确标签的对数概率的平均值。
第二，第四和第五个卷积层的特征图仅连接到位于同一GPU的上一层中的那些特征图（请参见图2）。第三个卷积层的特征图连接到第二层中的所有特征图。全连接层中的神经元连接到上一层中的所有神经元。第一和第二个卷积层后是响应归一化层。第4.4节中描述的最大池化层位于响应归一化层和第五个卷积层之后。 ReLU非线性函数应用于每个卷积层和全连接层的输出。
第一个卷积层使用4个像素的步长（这是特征图中相邻神经元的感受野中心之间的距离）过滤具有96个11×11×3大小的卷积核的224×224×3的输入图像。第二个卷积层将第一个卷积层的（响应归一化和池化后的）输出作为输入，并使用大小为5×5×48的256个卷积核对其进行过滤。第三，第四和第五个卷积层彼此连接，而没有任何中间的池化或归一化层。第三个卷积层具有384个大小为3×3×256的卷积核，这些卷积核与第二个卷积层的（归一化，池化后的）输出相连接。第四个卷积层具有384个3×3×192大小的卷积核，第五个卷积层具有256个3×3×192个大小的卷积核。全连接层每个都有4096个神经元。

5. 减少过拟合

我们的神经网络架构具有6000万个参数。尽管ILSVRC的1000个类别使每个训练样本在从图像到标签的映射上增加10位，但事实证明，如果学习这么多参数而又不考虑过拟合的情况是不够的。下面，我们描述了减少过拟合的两种主要方法。

5.1 数据增强

减少图像数据过拟合的最简单、最常见的方法是使用保留标签的变换（例如，参考文献4、5、30）人工增大数据集。我们采用两种不同的数据增强形式，这两种形式都允许通过很少的计算就可以从原始图像生成转换后的图像，因此不需要将转换后的图像存储在磁盘上。在我们的实现中，当GPU训练上一批图像时，转换后的图像在CPU上以Python代码生成。因此，这些数据扩充方案实际上是不需要计算的。
数据扩充的第一种形式包括生成图像平移和水平翻转。我们通过从256×256图像中随机提取224×224块（及其水平翻转）并在这些提取的块上训练我们的网络来做到这一点。当然，这将使我们的训练集的大小增加2048倍，尽管生成的训练样本是高度相互依赖的。如果没有这种方案，我们的网络将遭受严重的过拟合，这将迫使我们使用更小的网络。在测试时，网络通过提取五个224×224的块（四个角点块和中央块）及其水平翻转（因此总共有10个块）进行预测，并在这10个块上对网络的softmax层所做的预测值求平均。
数据增强的第二种形式包括更改训练图像中RGB通道的强度。具体来说，我们在整个ImageNet训练集中对RGB像素值集执行PCA。对于每个训练图像，我们添加找到的主成分的倍数，其大小与相应的特征值成正比，乘以从均值0和标准差0.1的高斯得出的随机变量。因此，对于每个RGB图像像素 $I_{xy}=[I_{xy}^R, I_{xy}^G, I_{xy}^B]^T$ ，我们添加以下量值：
$[p_1,p_2,p_3][\alpha_1\lambda_1,\alpha_2\lambda_2,\alpha_3\lambda_3]^T$
其中 $p_i$ 和 $λ_i$ 分别是RGB像素值的3×3协方差矩阵的第i个特征向量和特征值，而 $α_i$ 是上述随机变量。对于特定训练图像的所有像素，每个 $α_i$ 仅绘制一次，直到再次使用该图像进行训练为止，此时将其重新绘制。该方案近似地运用了自然图像的重要性质，即，对象ID对于光线的强度和颜色的变化是不变的。此方案将top-1错误率降低了1％以上。

5.2 Dropout层

结合许多不同模型的预测是减少测试错误的非常成功的方法，但是对于已经花了几天时间进行训练的大型神经网络来说，这代价似乎太昂贵了。但是，有一个非常有效的模型组合版本，在训练过程中仅花费大约两倍的代价。最近引入的技术称为“Dropout”，包括将每个隐藏神经元的输出以0.5的概率设置为零。以这种方式“Dropout”的神经元不会对正向传播做出贡献，也不参与反向传播。因此，每次输入时，神经网络都会对不同的体系结构进行采样，但是所有这些体系结构都会共享权重。由于神经元不能依赖于特定其他神经元的存在，因此该技术减少了神经元的复杂共适应。因此，被迫学习更健壮的功能，这些功能可与其他神经元的许多不同随机子集结合使用。在测试时，我们使用所有神经元，但将它们的输出乘以0.5，这可以合理地近似于采用指数量级Dropout的网络所产生的预测分布的几何平均值。
我们在图2的前两个全连接层中使用了dropout。如果没有dropout，我们的网络将表现出严重的过拟合。 Dropout大致会使收敛所需的迭代次数加倍。

6. 学习细节

我们使用随机梯度下降训练了模型，batchsize大小为128个样本，动量为0.9，权重衰减为0.0005。我们发现，少量的权重衰减对于模型的学习很重要。换句话说，此处的权重衰减不仅仅是一个正则化器，而且它可以减少模型的训练误差。权重w的更新规则为：
$\begin{aligned} v_{i+1}&=0.9*v_i-0.0005\cdot\epsilon\cdot w_i-\epsilon\cdot(\frac{\partial L}{\partial w}|w_i) _{D_i}\\ w_{i+1}&=w_i+v_{i+1} \end{aligned}$
其中i是迭代指数，u是动量变量，ε是学习率， $\frac{\partial L}{\partial w}|w_i$ 是在 $D_i$ 批次，对w求出的目标函数的导数的平均值。
我们从0均值高斯分布（标准差为0.01）初始化每一层的权重。我们使用常数1初始化第2，第4和第5个卷积层以及全连接的隐藏层中的神经元偏置。此初始化通过为ReLU提供正输入来加速学习的早期阶段。我们用常数0初始化其余层的神经元偏置。
我们对所有层使用了相同的学习率，我们在整个训练过程中手动对其进行了调整。我们遵循的启发式方法是，当验证错误率不再随着当前学习率提高而提高时，将学习率除以10。将学习率初始化为0.01，并在终止之前降低三倍。我们通过120万张图像的训练集对网络进行了大约90个周期的训练，这个过程在两个NVIDIA GTX 580 3GB的GPU上花了5-6天。

7. 结果

表1总结了我们在ILSVRC-2010上的结果。我们的网络实现的top-1和top-5测试集错误率分别为37.5％和17.0％。在ILSVRC-2010竞赛中，采用对六个以不同特征进行训练的稀疏编码模型所产生的预测结果进行平均的方法，其最佳性能分别为47.1％和28.2％，自那时以来，最佳结果分别为45.7％和25.7％，该方法将对根据两种类型的密集采样特征计算出的Fisher向量（FV）训练的两个分类器的预测求平均值。
我们也将模型输入了ILSVRC-2012竞赛，并在表2中报告了结果。由于ILSVRC-2012测试集标签不是公开可用的，因此我们无法报告所有尝试过的模型的测试错误率。在本段的其余部分中，我们可以互换使用验证和测试错误率，因为根据我们的经验，它们的相差不超过0.1％（请参见表2）。本文介绍的CNN的top-5错误率达到18.2％。五个相似的CNN的预测得出的平均错误率为16.4％。训练一个CNN，在最后一个池化层上再加上一个第六卷积层，以对整个ImageNet Fall 2011版本（1500万张图像，22K个类别）进行分类，然后在ILSVRC-2012上对其进行“微调”，得出的错误率为16.6 ％。将在整个2011年秋季发行版中预先训练的两个CNN与上述五个CNN的预测做平均，得出错误率15.3％。排名第二的竞赛项目采用从不同类型的密集采样特征中计算出的特征向量训练的几个分类器的预测结果做平均，错误率达到26.2％。
表1 ILSVRC-2010测试集的结果比较

模型	Top-1 (%)	Top-5 (%)
Sparse coding	47.1	28.2
SIFT + FVs	45.7	25.7
CNN	37.5	17.0

（斜体是其他模型获得的最好结果）
表2. ILSVRC-2012验证和测试集的错误率比较

模型	Top-1 (val, %)	Top-5 (val, %)	Top-5 (test, %)
SIFT + FVs	–	–	26.2
1 CNN	40.7	18.2	–
5 CNNs	38.1	16.4	16.4
1 CNN*	39.0	16.6	–
7 CNNs*	36.7	15.4	15.3

（斜体是其他模型获得的最好结果，带有“ *”的模型是经过“预训练”，然后对整个ImageNet 2011 Fall版本进行分类的模型（有关详细信息，请参见第7节））
最后，我们还报告了ImageNet 2009年秋季版本的错误率，其中包含10,184个类别和890万张图像。在此数据集上，我们遵循文献中的惯例，即使用一半的图像进行训练，一半的图像进行测试。由于没有已经准备好的测试集，因此我们的划分必然不同于以前的作者使用的划分，但这不会对结果产生明显影响。通过上述网络，我们在此数据集上的top-1和top-5错误率分别为67.4％和40.9％，但在最后一个池化层后还有一个第六卷积层。在该数据集上发布的最佳结果是78.1％和60.9％。

7.1 定性评估

图3显示了网络的两个数据连接层所学习的卷积核。网络已经学会了从各种频率和方向选择卷积核，以及各种有色块。请注意，这是两个GPU表现出的专业化程度，这是第4.5节中描述的受限连接的结果。GPU 1上的卷积核在很大程度上与颜色无关，而GPU 2上的卷积核在很大程度上是与特定颜色有关的。这种特殊化发生在每次运行期间，并且与任何特定的随机权重初始化（对GPU进行重新编号取模）无关。
在图4的左边面板中，我们通过在八幅测试图像上计算其top-5预测值，定性评估网络所学到的知识。请注意，即使偏离中心的对象（例如左上角的螨）也可以被网络识别。大多数的top-5标签看起来都是合理的。例如，只有某些类型的猫被认为是豹的合理标签。在某些情况下（如谷物，樱桃），获得的焦点不是照片真实的焦点。
获得网络所学习到的视觉知识的另一种方法是考虑由最后4096维隐藏层中的图像产生的特征向量。如果两个图像产生了欧氏距离较小的特征向量，则可以说神经网络的较高层将它们视为相似。图4显示了根据此度量方式，来自测试集的五幅图像与来自训练集哪六幅图像最为相似。请注意，在像素级别，检索到的训练图像通常在第二层中不接近第一列中的测试图像。例如，我们所得到的狗和大象以各种姿势出现。我们在补充材料中提供了更多测试图像的结果。
通过使用两个4096维实值向量之间的欧几里德距离来计算相似度是效率低下的，但是可以通过训练自动编码器将这些向量压缩为短二进制码来提高相似度。与将自动编码器应用于原始像素相比，此方法将产生一种更好的图像检索方法，将自动编码器应用于原始像素的方法不使用图像标签，因此有检索具有相似边缘的图像的趋势，而无论两图像在语义上是否相似。

图3. 在224×224×3的输入图像上的第一个卷积层学习到九十六个卷积核，大小为11×11×3。在GPU 1上学习了前48个卷积核，而在GPU 2上学习了后48个卷积核（有关详细信息，请参见第7.1节）

图4. 左边是八张ILSVRC-2010测试图像和我们的模型认为最可能的五个标签，正确的标签写在每个图像下，并用红色条显示（如果它恰好位于前5位）。右边第一列是五个ILSVRC-2010测试图像，其余的列显示了六个训练图像，这些图像在最后一个隐藏层中生成特征向量，与第一列的测试图像的特征向量的欧几里得距离最小

8. 讨论

我们的结果表明，大型的深层CNN能够使用纯粹的有监督学习在具有挑战性的数据集上取得创纪录的结果。值得注意的是，如果移除单个卷积层，我们的网络性能就会下降。例如，删除任何中间层都会导致网络的top-1性能损失约2％，因此深度对于实现我们的结果确实很重要。
为了简化我们的实验，我们没有使用任何无监督的预训练，即使我们希望这会有所帮助，尤其是如果我们获得足够的计算能力来显著增加网络的大小而又没有将带标记的数据量相应增加时。到目前为止，由于我们扩大了网络规模并对其进行了更长时间的训练，我们的结果有所改善，但为了达到人类的视觉能力，我们还有许多路要走。最终，我们希望在视频序列上使用非常大且深的卷积网络，这里面时间结构提供了非常有用的信息，即在静态图像中丢失或不那么明显的信息。

9. 结语

计算机视觉界对SuperVision的成功反应巨大。在接下来的一两年中，研究者们转向使用深度神经网络，而现在，这些网络已被Google，Facebook，Microsoft，百度和许多其他公司广泛部署。到2015年，更好的硬件，更多的隐藏层以及多项技术进步将深度卷积神经网络的错误率降低了三倍，因此，它们现在已经非常接近于静态图像的人类能力。这场革命的大部分功劳应该归功于那些花了很多年开发CNN技术的开拓者，但是FeiFei等人提供了所必需的条件。她付出了巨大的努力来制作带标签的数据集，直到该数据集足够大，可以展示出神经网络的真正作用。

参考文献

你可能感兴趣的:(Deep,Learning,Research,Deep,Learning)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
全球核酸样品制备市场展望：2030年预计达到6387.4百万美元恒州诚思CC 人工智能大数据数据库数据分析
随着全球生物技术和生物医药行业的迅速发展，核酸样品制备市场正逐渐成为一个重要的生命科学领域。据恒州恒思（YHresearch）团队的研究数据显示，2023年全球核酸样品制备市场规模已达到4158.5百万美元，并预计在未来六年内，该市场将以年复合增长率（CAGR）6.5%的速度增长，到2030年市场规模预计将达到6387.4百万美元。核酸样品制备主要用于提取和纯化DNA和RNA样本，以供后续的分子生
【双语新闻】AGI安全与对齐，DeepMind近期工作曲奇人工智能安全 agi 安全 llama 人工智能
我们想与AF社区分享我们最近的工作总结。以下是关于我们正在做什么，为什么会这么做以及我们认为它的意义所在的一些详细信息。我们希望这能帮助人们从我们的工作基础上继续发展，并了解他们的工作如何与我们相关联。byRohinShah,SebFarquhar,AncaDragan21stAug2024AIAlignmentForumWewantedtosharearecapofourrecentoutput
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
2024全球数字电影摄像机、相机、广播摄像机市场报告 8K超高清数码相机人工智能科技
一、全球数字电影摄像机市场规模①全球数字电影摄像机市场销售额市场调研机构恒州博智QYResearch统计，2022年全球数字电影摄像机市场销售额达到31.19亿元，2023年全球数字电影摄像机市场销售额达到33.7亿元，预计未来将持续保持平稳增长的态势，到2030年市场规模将接近53亿元，未来六年CAGR为6.3%。②全球主要数字电影摄像机制造商品牌全球主要的数字电影摄像机制造商包括阿莱、索尼、佳
Lt-8 Multithreading yanlingyun0210 java
IntendedLearningOutcomesTounderstandtheconceptofconcurrency.Tounderstandthedifferenceofaprocessandathread.TodefineathreadusingtheThreadclassandRunnableinterface.TocontrolthreadswithvariousThreadmethod
如何使用Pytorch-Metric-Learning？鱼儿也有烦恼 PyTorch pytorch
文章目录如何使用Pytorch-Metric-Learning？1.Pytorch-Metric-Learning库9个模块的功能1.1Sampler模块1.2Miner模块1.3Loss模块1.4Reducer模块1.5Distance模块1.6Regularizer模块1.7Trainer模块1.8Tester模块1.9Utils模块2.如何使用PyTorchMetricLearning库中的
[Kaiming]Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification MTandHJ neural networks
文章目录概主要内容PReLUKaiming初始化ForwardcaseBackwardcaseHeK,ZhangX,RenS,etal.DelvingDeepintoRectifiers:SurpassingHuman-LevelPerformanceonImageNetClassification[C].internationalconferenceoncomputervision,2015:1
深度神经网络详解：原理、架构与应用阿达C 活动 dnn 计算机网络人工智能神经网络机器学习深度学习
深度神经网络（DeepNeuralNetwork，DNN）是机器学习领域中最为重要和广泛应用的技术之一。它模仿人脑神经元的结构，通过多层神经元的连接和训练，能够处理复杂的非线性问题。在图像识别、自然语言处理、语音识别等领域，深度神经网络展示了强大的性能。本文将深入解析深度神经网络的基本原理、常见架构及其实际应用。一、深度神经网络的基本原理1.1神经元和感知器神经元是深度神经网络的基本组成单元。一个
前端开发需要了解的算法知识史努比的大头算法前端
手写深拷贝functiondeepClone(obj){//处理基础数据类型和函数if(obj===null||typeofobj!=='object'){returnobj;}//处理数组if(Array.isArray(obj)){returnobj.map(item=>deepClone(item));}//处理对象constclonedObj={};for(constkeyinobj){i
推荐开源项目：PyTorch-Metric-Learning 潘惟妍
推荐开源项目：PyTorch-Metric-Learningpytorch-metric-learningTheeasiestwaytousedeepmetriclearninginyourapplication.Modular,flexible,andextensible.WritteninPyTorch.项目地址:https://gitcode.com/gh_mirrors/py/pytorc
推荐：FastAPI驱动的稳定扩散LLMs演示项目褚知茉Jade
推荐：FastAPI驱动的稳定扩散LLMs演示项目FastAPI-for-Machine-Learning-Live-DemoThisrepositorycontainsthefilestobuildyourveryownAIimagegenerationwebapplication!OutlinedarethecorecomponentsoftheFastAPIwebframework,anda
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam