jho9o5

【3】卷积神经网络的本质探索

文章目录

- 引子
- 1.简单了解CNN的历史背景
- 2.初步认识CNN的基本架构
- 3.深入理解CNN的设计原理
- - 3.1图像在计算机中的存储与表达
  - 3.2 不变性（Invariance）
  - 3.3 前馈神经网络 ---- 图片识别
  - 3.4 卷积神经网络 ---- 图片识别
  - - 3.4.1 局部连接（重点）
    - 3.4.2 参数共享（重点）
    - 3.4.3 输出表达
    - 3.4.4 Depth维的处理
    - 3.4.5 Zero Padding（零填充）
    - 3.4.6 特征抓取
    - 3.4.7 多filters
    - 3.4.8 加入非线性（ReLU）
    - 3.4.9 Max Pooling
    - 3.4.10 Fully Connected Layer
  - 3.5 经典的 ConvNet 架构
- 参考资料

引子

在深度神经网络的领域下，卷积神经网络（Convolutional Neural Networks，以下简称CNN ）是最为成功的DNN的应用之一，CNN广泛应用于图像识别领域，它也可以应用于NLP领域。
我们在图像处理中，往往把图像表示为像素的向量，比如一个1000×1000的图像，可以表示为一个 $10^{6}$ 的向量。在前面学习提到的神经网络中，如果隐藏层数目与输入层一样，即也是 $10^{6}$ 时，那么输入层到隐含层的参数个数为 $10^{6}×10^{6}$ = $10^{12}$ ，这样参数就太多了，基本没法训练。
因此，我们如果想通过神经网络进行图像处理，必须考虑的问题就是，如何减少训练参数数量以加快收敛速度。CNN就是来解决这一难题的有效手段，它到底使用了哪些 $\;tricks$ 呢？我们赶紧进入CNN的学习之旅吧！

1.简单了解CNN的历史背景

CNN最早是Yann LeCun在1998年提出来的，他首次简单展示了一个实例：应用反向传播和基于梯度的学习方法，来训练卷积神经网络。这对文档识别非常有效，尤其对邮政编码识别效果极好，因此这些方法在邮政服务中被广泛用于邮政编码识别。然而它并不能扩展到更具有挑战、更复杂的数据。数字非常容易识别，但识别也是有局限性的。

于是在 2012 年，Alex Krizhevsky 提出了一种现代化的卷积神经网络。他提出的网络，我们一般称为 AlexNet。但他的网络和 Yann LeCun 提出的卷积神经网络相比，看上去并没有多大差异。它们只是扩展的更大更深。更重要的一部分是它们可以充分利用大量数据可得到的图像（ImageNet 数据集），同时也充分发挥了 GPU 并行计算能力的优势。

因AlexNet在ImageNet数据集上的出色表现（拿下了当年大赛的第一名，且精度提高了好几个百分点），卷积神经网络开始大火，得到广泛的应用。

2.初步认识CNN的基本架构

我们以LeCun在1998年发表的论文中，提到的LeNet-5的结构为例进行分析：

图中是一个字母识别的CNN模型，可以看出最左边的“K”的图像就是我们的输入层，这里我们输入的为灰度图(一个由0~255的数字组成的矩阵)；

接下来箭头所指的是卷积操作，将输入层的矩阵，进行卷积之后，得到新的矩阵。这一层我们称之为卷积层，我们可以先观看下面的动态图提前了解一下它到底干了些啥，后面会详细解剖此过程；

在卷积层之后，进行的是子采样(subsampling 或 downsampling)操作，当然我们更为常见的叫法是池化(pooling)操作（个人觉得子采样更好理解有木有-.-），卷积层经过池化之后，同样也是生成几个小矩阵，特征维度进一步缩小，这一层我们称之为池化层，同样可以先看看下面的动态图，之后再详细展开说明；

“卷积层+池化层”的组合，可以在隐藏层出现多次，当然，我们也可以灵活使用“卷积层+卷积层”，或者“卷积层+卷积层+池化层”的组合，这些在构建模型时没有限制，根据项目的实际需要，可自行配置，不过最常见的还是卷积层+池化层的组合。

在若干“卷积层+池化层”的组合之后，是全连接层（Fully Connected Lay，简称FC），它把上一层得到的所有矩阵，展开(reshape)成一个一维列向量，然后再喂给Softmax激活函数（或其他函数），最终的输出就是我们预测它是哪一个字母（我猜测这里应该就是一个26维的one-hot向量）。

个人感受：

在之前学习集成学习的stacking框架的时候，有人说“stacking和神经网络一样，都属于表示学习（representation learning）”，即从原始的特征空间中，使用一定的手段，提取出有效的特征，然后进行训练。这一做法既提升了模型预测的精度，又降低了特征的维度，缩短了训练时长。

现在看来，CNN就是完美地发扬了这一理念啊，前面不断地进行卷积+池化，为的就是展开得到关键特征向量，然后喂给最后的全连接层。为了防止过拟合，我们在全连接层应该尽量选用比较简单的模型，如Softmax进行多分类预测。

2019/7/1补充：

[我们知道，机器学习的实质过程就是从原始样本提取出由关键特征表示的列向量，再把这个列向量喂给学习器进行训练，当损失最小时，对应的模型参数，即为我们求解的模型。

站在这个角度，卷积神经网络的做法也就好理解了，原始样本（image）是以矩阵的形式存储的，如果直接展开成一维向量，那么作者认为会损失了数据的结构信息，换句话来说，原始样本自带的结构，在作者看来也是一个重要的特征！

但是图片的特征维度太高了，训练起来速度会很慢，那么有没有什么办法，既可以降维，又可以提取出样本的结构信息呢？作者便提出卷积(之后再激活)加池化的神经网络思想，卷积和池化其实换另一种表达更加贴切，filtering(+ReLU) and downsampling 。最终可以将原始的图片样本，转换成一个列向量，交给学习器训练。]

关于卷积层的分层，有两种不同的观点：

（1）卷积层是由复杂的、三个阶段的子层组成的

第一阶段子层：执行卷积运算（线性变换，从输入中提取特征）
第二阶段子层：执行非线性的激活函数（如ReLU单元，非线性变换，引入非线性，实际应用中这一阶段可以被丢弃，因为第三阶段同样可以引入非线性）
第三阶段子层：通过池化函数调整输出（非线性变换，降低输出维度，但是保留大部分重要信息）

（2）卷积层是简单的，仅仅是包含卷积运算，这是目前流行的观点

下面这张图可以完整诠释上面这一段话的过程。

3.深入理解CNN的设计原理

3.1图像在计算机中的存储与表达

我们人眼观测到的图像，是根据物体的反光得到的，那么在计算机中，图像是如何存储与表达的呢？

我们可以将上述的输入矩阵，从左到右，从上到下展开成一个很长的列向量，喂给一个分类器（如SVM）进行训练，也可以取得不错的预测准确率，但是这样的话，会失去平面结构的信息，为保留该结构信息，通常选择矩阵的表示方式。

当然，真实世界中，我们看到更多的是彩色图像，即基于RGB颜色模型生成的图像。相信大家在小时候都知道，三原色指的是红绿蓝，这三种颜色以不同比例叠加在一起，可以生成各种各样的颜色。

基于这个原理，我们在计算机中，存储“彩色图像”，就需要用到三个矩阵，三个矩阵叠加在一起，即可表示任何一张图像，如下图所示：

因此，我们给模型的输入，就应该是一个shape为(width,height,depth)的三维张量。我们的模型在设计时，就需要开始考虑，如何进行识别这种“ 数字长方体”。

3.2 不变性（Invariance）

在进行识别“数字长方体”之前，我们必须清楚这么一个概念，即我们的模型，必须要满足不变性。

所谓的不变性，就是一个图像中的一个物体，不管在图像中的什么位置，还是经过旋转、缩放、光线明暗变化等操作变换，都可以被我们的模型识别为同一个物体！

为了理解卷积神经网络对于这些不变性特点所作出的突出贡献，我们先用不具备不变性特点的前馈神经网络来进行对比。

3.3 前馈神经网络 ---- 图片识别

以灰度图（width=4,height=4,depth=1）来举例，在下图中，黄色圆表示值为0的像素点，黑色圆表示值为1的像素点，我们知道不管这个“横折”出现在图片中的什么位置，它都应该被视作是相同的“横折”。

若训练前馈神经网络来完成该任务，那么原图像的三维张量将会被摊平成一个向量，即(4, 4, 1)的图片会被展成维度为16的向量作为网络的输入层。再经过几层不同节点个数的隐藏层，最终输出两个节点，分别表示“有横折的概率”和“没有横折的概率”，如下图所示：

下面我们以十六进制对图片中的每一个像素点（pixel）进行编号。如果仅仅使用右侧那四组物体位于中间的训练数据来训练网络时，网络就只会对编号为5,6,9,a的节点的权重进行调节。若让该网络识别位于右下角的“横折”时，则无法识别。

【 解决办法 】：使用大量的、物体位于不同位置的图像数据进行前馈神经网络的训练，另外加深隐藏层的数目，从而扩大网络学习这些变体的能力。

【缺点】：这么做的确可行，但是效率十分低下，因为同一个“横折”，只是处在图像中的位置不同，但实际上还是同一个东西啊。那为什么相同的东西在位置变了之后还要重新学习呢？有没有什么方法可以让我们在某个位置所学到的规律也运用在其他的位置？换句话说，我们希望能在不同的位置使用相同的权重进行学习。

3.4 卷积神经网络 ---- 图片识别

卷积神经网络就是让权重在不同位置共享的神经网络，如何理解这句话，请继续往下看。

3.4.1 局部连接（重点）

在卷积神经网络中，我们先选择一个固定大小的局部区域，然后用这个局部区域去扫描整张图片。 局部区域所圈起来的所有节点会被连接到下一层的同一个节点上。

2019/7/1补充：

[有的地方，将局部连接这个性质，称为稀疏交互（Sparse Interaction）。在前馈神经网络中，任意一对输入与输出神经元之间都产生交互，形成稠密的连接结构；而在卷积神经网络中，卷积核的尺度远小于输入的维度，这样每个输出神经元仅与上一层特定局域区域内的神经元存在连接。

具体来讲，假如网络中相邻两层分别具有 $m$ 和 $n$ 个神经元，那么全连接网络中的权值参数矩阵的参数个数为 $n \times m$ ；对于稀疏交互的卷积网络，如果卷积核的元素数为 $k$ ，那么该层的参数总量为 $n \times k$ 。

在实际应用中，一般k值远小于m即可取得不错的效果，并且优化过程的时间也减少了几个数量级，过拟合的情况也得到了改善。]

为了更好的和前馈神经网络做比较，我们依然把这些以矩阵排列的节点展成向量的形式，并进行编号。下图展示了被红色方框所圈中编号为0,1,4,5的节点是如何通过 $w_1,w_2,w_3,w_4$ 连接到下一层的节点0上的。

这个带有权重的红色方框就叫做 filter 或 kernel 或 feature detector（特征探测器）。filter 的大小叫做 filter size，下面所展示的 filter size 为 2x2： $\left[ \begin{array}{ll}{w_{1}} & {w_{2}} \\ {w_{3}} & {w_{4}}\end{array}\right]$ 在下一层中，定义第0个节点的值为 $y_0$ ，它等于被圈中的小矩阵与 filter 矩阵对应位置元素相乘之后的累加和，当然，必不可少的还要加上一个 bias 项（理由在前面的文章中解释过），具体计算式如下： $\begin{array}{l}{y_{0}=x_{0} * w_{1}+x_{1} * w_{2}+x_{4} * w_{3}+x_{5} * w_{4}+b_{0}} \\\\ {y_{0}=\left[ \begin{array}{llll}{w_{1}} & {w_{2}} & {w_{3}} & {w_{4}}\end{array}\right] \cdot \left[ \begin{array}{c} {x_{0}} \\ {x_{1}} \\ {x_{4}} \\ {x_{5}}\end{array}\right]+b_{0}}\end{array}$

稀疏交互（局部连接）的物理意义

通常图像、文本、语音等现实世界中的数据都具有局部的特征结构，我们可以先学习局部的特征，再将局部的特征组合起来，形成更复杂和抽象的特征。以人脸识别为例，最深层（靠近输出层）的神经元可以检测出各个角度的边缘特征，位于中间层的神经元，可以将边缘特征组合起来，得到鼻子、嘴巴、眼睛等复杂特征；位于

3.4.2 参数共享（重点）

当 filter 扫到样本矩阵中的其他位置时，计算输出节点 $y_i$ 时， $w_1,w_2,w_3,w_4,b_0$ 都是共用的。

仔细观察上图，我们需要注意以下几点：

红色方框每次从左到右移动一位，这个我们称之为 stride（步长）；
从动态图的最后一帧可以看到，第一层与第二层之间，并不是全连接的，第二层中的每个节点只与上一层的四个节点连接，我们前面提到的前馈神经网络，每两层之间都是全连接的，因此它也被称为全连接神经网络；

参数共享的物理意义，就是我们前面提到的不变性，即一个图像中的某个物体，不管它处于什么位置，还是经过了旋转、缩放、光线明暗变换等操作，都可以被模型识别为同一个物体。

3.4.3 输出表达

上一小节的介绍中，我们为了理解方便，所以把输入矩阵换成了列向量的形式，卷积之后的矩阵，也展开成了列向量的形式，前面说过，向量表达会丢失了平面结构信息，因此我们依然以矩阵的方式来排列它们，如下图所示：

经过卷积操作之后，生成的新矩阵，我们一般称为 Feature Map 或者 Convolved Feature.

3.4.4 Depth维的处理

经过前面的学习，我们已经知道了depth=1的灰度图，应该如何进行卷积操作了，那么对于更常见的3 channels的RGB图，如何进行卷积呢？

不妨想象一下，你的面前放着一个三阶魔方，如果你还是像刚才那样，用一个 2×2 的 filter 进行扫描，我们的filter只能在一个平面上移动，那你每次只能扫描到其中的一层，另外的两层，你没办法同时扫描到。

解决办法很简单，我们增加 filter 的 depth 即可，即在原来的 filter 的底下，再增加两个 2×2 的权重矩阵，即我们现在的 filter size 变成了（2,2,3），在空间中也变成了一个长方体了。

另外需要再提一下的是， filter 的每一层的权重矩阵是共享的，但是层与层之间的权重矩阵是不共享的，即 filter 由三个大小相同但是值不同的权重矩阵组成。如下面所示： $\left[ \begin{array}{cc}{w_{r 1}} & {w_{r 2}} \\ {w_{r 3}} & {w_{r 4}}\end{array}\right], \left[ \begin{array}{cc}{w_{g 1}} & {w_{g 2}} \\ {w_{g 3}} & {w_{g 4}}\end{array}\right], \left[ \begin{array}{cc}{w_{b 1}} & {w_{b 2}} \\ {w_{b 3}} & {w_{b 4}}\end{array}\right]$

举例：一个(2,2,3)的filter，对RGB图片的第一个局部区域进行卷积计算的式子为：
$y_{0}=x_{r 0} * w_{r 1}+x_{r 1} * w_{r 2}+x_{r 4} * w_{r 3}+x_{r 5} * w_{r 4}$

$x_{g 0} * w_{g 1}+x_{g 1} * w_{g 2}+x_{g 4} * w_{g 3}+x_{g 5} * w_{g 4}$

$x_{b 0} * w_{b 1}+x_{b 1} * w_{b 2}+x_{b 4} * w_{b 3}+x_{b 5} * w_{b 4}+bias$

向量化表达即为：
$y_{0}=\left[\begin{array}{llll}{w_{r 1}} & {w_{r 2}} & {w_{r 3}} & {w_{r 4}}\end{array}\right] \cdot\left[\begin{array}{c}{x_{r 0}} \\ {x_{r 1}} \\ {x_{r 4}} \\ {x_{r 5}}\end{array}\right]$

$\;\;\;\;+\left[\begin{array}{llll}{w_{g 1}} & {w_{g 2}} & {w_{g 3}} & {w_{g 4}}\end{array}\right] \cdot\left[\begin{array}{c}{x_{g 0}} \\ {x_{g 1}} \\ {x_{g 4}} \\ {x_{g 5}}\end{array}\right]$

$\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;+\left[\begin{array}{llll}{w_{b 1}} & {w_{b 2}} & {w_{b 3}} & {w_{b 4}}\end{array}\right] \cdot\left[\begin{array}{c}{x_{b 0}} \\ {x_{b 1}} \\ {x_{b 4}} \\ {x_{b 5}}\end{array}\right]+bias$

也就是说，原始样本为一个空间中的立方体，经过一个卷积核卷积之后，随后生成的是一个二维空间的矩阵！！！

最后观察下方动态图来直观理解depth维的卷积过程：

3.4.5 Zero Padding（零填充）

我们可能会想，4×4 的图像经过 2×2的 filter 卷积之后变成了 3×3 的图像，如果每次卷积之后都会缩小一圈的话，那不是经过若干次卷积之后，我们的图像变得越来越小了？

Zero padding就是用来解决这个问题的，它的作用就是控制 Feature Map 的输出尺寸，同时避免原始图像的边缘侧信息被一步步舍弃的问题。

例如，下面黄色区域是一个4x4的图像，我们在其边缘进行 Zero padding 一圈之后，再用3x3的 filter 进行卷积，最终得到的Feature Map的尺寸，将依旧是 4×4 。

通常大家都想要在卷积时保持图片的原始尺寸，常常选择3x3的filter和填充为1的zero padding，或5x5的filter和填充为2的zero padding。

另外，3x3的filter可以考虑像素点与其距离为1的所有其他像素点之间的关系，而5x5的filter则是可以考虑像素点与其距离在2以内的所有其他像素点的关系，因此，3x3 和 5x5 是卷积核的常用尺寸！

【拓展】卷积之后的 Feature Map 的 Size 计算方法

假设输入的图像 Size 为 (origin_width,origin_height)，卷积之后的 Feature Map 的 Size 为(new_width,new_height)，其实计算new_width和new_height的方式是一样的，这里以new_width为例进行分析：

【公式不在于记忆，而在于理解，下面是公式的具体理解过程】

首先呢，我们要计算 filter 可以在水平方向滑动的范围：

(1) x_range = origin_width + 2×padding_width - filter_width

公式很好理解，图像的原始宽度，加上我们零填充的宽度（因为是左右两边都要填充，所以要乘以2），于是得到了卷积之前的图像宽度，然后再减去卷积核 filter 的宽度，得到的就是我们可以水平滑动的总长度 x_range。

计算出可以滑动的总长度之后，我们用该值除以滑动的步长 stride，不就计算出来可以滑动的总次数了吗？然后在加上第一个不需要滑动也存在的输出节点之后，就可以得到最终 Feature Map 的 new_width 了，如下所示：

(2) new_width = x_range / stride + 1

最终，我们来一个大合并，Feature Map的尺寸计算公式如下：

(3) output_size = (input_size + 2×padding_size − filter_size)/stride+1

用上面的例子代入计算，input_size 为(3,3)， padding_size 为1，filter_size 为(3,3)，stride 为1，最终的 output_size 为：
$output\_size =( ((4+2*1-3)/1 +1), ((4+2*1-3)/1 +1) ) = (4,4)$

3.4.6 特征抓取

经过前面几个小节的学习，我们已经知道了filter是如何工作的，那么你一定很好奇，Feature Map对应的图像，到底是什么样子的呢？

下面我们进行展示，不同参数设置下的 filter 对原始图像进行卷积之后，所生成的Feature Map的图像。

原始图像：

不同参数的 filter 卷积之后的图像：（面试可能会聊不同filter的作用是什么？）

滤波器可以从原始的像素特征中抽取某些特征，如：边缘、角度、形状等，以sobel算子为例：
$\mathbf{K}_{v}=\left[\begin{array}{rrr}{-1} & {0} & {+1} \\ {-2} & {0} & {+2} \\ {-1} & {0} & {+1}\end{array}\right] \quad \mathbf{K}_{h}=\left[\begin{array}{ccc}{+1} & {+2} & {+1} \\ {0} & {0} & {0} \\ {-1} & {-2} & {-1}\end{array}\right]$

其中 $\mathbf K_v$ 表示检测垂直边缘的滤波器，它沿着水平方向做卷积； $\mathbf K_h$ 表示检测水平边缘的滤波器，它沿着垂直的方向做卷积。

原始灰度图：

经过 $\mathbf K_v$ 卷积之后：

经过 $\mathbf K_y$ 卷积之后：

举上面的例子呢，是希望能够更直观地理解 $f i l t e r$ 被称为滤波器的原因。

个人学习感受，卷积核 filter 的训练，实际上就是根据我们想要识别什么 target ，然后用大量的图像数据进行训练，最终得到一个可以过滤掉与 target 无关的像素点，留下与 target 相关的像素点的 filter ！最终教会神经网络模型，它应该以什么的方式，来“观察”图像。

还有一点值得说明的是，上面的两个例子，是在第一次卷积之后，Feature Map 的输出图像，这个时候我们还是可以看清原图的形状和轮廓的，不过随着卷积操作的不断深入，越里面的卷积层，所抓取的信息越来越抽象，解释性越来越弱。 比如说，下面这个手写体数字识别的例子：

3.4.7 多filters

每个 filter 可以抓取探测特定的形状的存在。假如我们要探测下图的长方框形状时，可以用4个 filter 去探测4个基础“零件”。

因此，我们在实际进行CNN的训练中，一般需要设置多个不同的 filter。不同的 filters 扫描过后可得到不同特点的 Feature Maps 。每增加一个 filter，就意味着你想让网络多抓取一个特征。

由此一来，我们卷积层的输出，将不再是一个平面上的矩阵，而是一个空间中的长方体！ 如下图所示：

在前面的讲解中，我们已经使用了一个 filter 进行了扫描，得到了卷积层中，最上层的黄色矩阵，这里分别用了紫色的filter、蓝色的filter、棕色的 filter再次进行扫描，依次生成了紫、蓝、棕色的矩阵，最终得到的是一个长方体！

卷积层的输入是长方体，输出也是长方体，这个长方体可以作为新的输入，送给下一个卷积层进行处理。

【拓展】卷积之后的 “长方体” 的 Size 计算方法

其实上面的图已经很形象的展示了，width 和 height 的计算方法还是不变的，depth 的值，其实就是 filter 的个数，这一点也毋庸置疑了，附上一张cs231n上的总结。

3.4.8 加入非线性（ReLU）

像前面学过的深度神经网络一样，我们把上一层的输入加权求和之后，会进行一个激活操作，当时推荐的是ReLU激活函数，然后再将值传给下一层。这种非线性的转换，有利于提升网络的稳健性，并防止过拟合。

同样，我们在卷积神经网络中，对于得到的Feature Maps（多个卷积后的特征矩阵），也要进行非线性转换（ReLU函数），它是一个 element-wise 的操作，对 Feature Map 矩阵中的每一个元素进行ReLU激活。

为什么叫非线性转换呢？大家可不要学着学着就忘了，本文的前面有过详细的图解，我们卷积层的每一个元素，都是上一层的矩阵中的某几个和 filter 中的每一个元素进行加权求和，最后再加上一个bias项得到，这不就是一个线性转换的过程吗？咱们再把这个值喂给ReLU函数，最终我们得到的值，和上一层的矩阵中的那几个元素，就不再具有线性对应关系了，所以这就叫做非线性转换呀~

附上一张经典图解释上述的过程：

3.4.9 Max Pooling

在前面所说的 卷积 + ReLU 操作之后，还会有一个 pooling 操作，一般有 max pooling 和 average pooling，这里以最受欢迎的 max pooling 为例进行说明。

其实 max pooling 的原理很简单，将整个图像划分出若干个大小相等并且无重叠部分的小块，每一个小块只取其中最大的数字，再舍弃掉其他的节点，并保持原来的平面结构输出，如下图所示：

需要注意的是，max pooling 操作在不同 depth 的平面上是独立执行的，即每次只能从当前平面内的某一小块中选择最大值，并舍弃当前小块内的其他节点，如下图所示：

【问题】max pooling 到底有什么作用？节点信息被舍弃后，难道没有什么影响吗？
从直觉上来说，我们人类在观察某张图片的时候，只有特定区域的像素点对于我们而言是有效的，而图像中其他的像素点，实际上是冗余信息，对于我们的判断起不了什么作用。max pooling 的主要功能是 downsampling，就是用来去除 Feature Map 中的冗余信息（或者说像素点、特征）。

如下图所示，我们输入的是三个 4×4 矩阵可知，它们代表的都是一个物体（横折），只是出现的位置不同，那么我们期望，模型最终学习到的特征，应该尽可能一致。之后我们用一个 2×2 的 filter 分别对三个输入矩阵进行扫描，生成的每一个 Feature Map 都是一个 3×3 的矩阵。此时我们再用 3×3 的 max pooling kernel 对 Feature Map 进行 pooling 操作的话，每一个 Feature Map 的最终输出都是 3 ，符合我们的期望效果。

上面的例子，粗略地展示了 max pooling 可以用来剔除冗余信息的作用，当然，实际情况肯定比这更加复杂，我们不用 max pooling 操作，最终肯定也可以让神经网络学习并判断图像中是否有“横折”，但是计算的代价比较大，max pooling 虽然是一种近似效果，但是减少了训练的参数，甚至还起到了一定的防止过拟合的效果！

当然咯， max pooling 并不是有百利而无一害，也有可能出现这么一种情况，某些周边信息对我们想要抓取的概念是否存在的判定也有一定的影响，但是被我们给过滤掉了。

3.4.10 Fully Connected Layer

当抓取到足以识别图像的特征之后，接下来就是如何进行分类。全连接层（简称FC），这一层负责处理输入内容（该输入可能是卷积层、ReLU 层或是池化层的输出），并最终输出一个 N 维向量，N 是该程序必须选择的分类数量。

我在这一开始有一个错误的认识，我以为全连接层，就是把前面卷积、池化得到的长方体，平摊成一列长向量，然后再喂给一个分类函数（如Softmax）进行分类的预测，这个想法不太正确，我们所说的全连接层，不是说只有一层神经网络，而是一个全连接的神经网络（前馈神经网络），它的输入是前面说的长向量，经过前馈神经网络训练，最终得到模型的输出。

下面这个图，就十分简单而形象地展示了CNN的整个预测过程：

多啰嗦几句，讲到全连接层这里，它其实也呼应了我在文章前面谈到的感受，卷积神经网络的前面很多层网络，它的核心功能就是特征提取，最后简单几层网络用来模型的预测与输出，全连接层的神经网络一般比较简单，不会太深，我也提到过，太复杂的话，就会导致整个神经网络过拟合了！

3.5 经典的 ConvNet 架构

LeNet (1990s)：第一个成功的卷积神经网络应用，是Yann LeCun在上世纪90年代实现的。当然，最著名还是被应用在识别数字和邮政编码等的 LeNet 结构；
AlexNet (2012)：AlexNet 卷积神经网络在计算机视觉领域中受到欢迎，它由Alex Krizhevsky，Ilya Sutskever和Geoff Hinton实现。AlexNet在2012年的ImageNet ILSVRC 竞赛中夺冠，性能远远超出第二名（16%的top5错误率，第二名是26%的top5错误率）。这个网络的结构和LeNet非常类似，但是更深更大，并且使用了层叠的卷积层来获取特征（之前通常是只用一个卷积层并且在其后马上跟着一个池化层）；
ZF Net (2013)：Matthew Zeiler和Rob Fergus发明的网络在ILSVRC 2013比赛中夺冠，它被称为 ZFNet（Zeiler & Fergus Net的简称）。它通过修改结构中的超参数来实现对AlexNet的改良，具体说来就是增加了中间卷积层的尺寸，并且让第一层的 stride 和 filter size 更小；
GoogLeNet (2014)：ILSVRC 2014的获胜者是谷歌的Szeged等实现的卷积神经网络。它主要的贡献就是实现了一个Inception模块，它能够显著地减少网络中参数的数量（AlexNet中有60M，该网络中只有4M）。还有，这个论文中没有使用卷积神经网络顶部使用全连接层，而是使用了一个平均汇聚，把大量不是很重要的参数都去除掉了。GooLeNet还有几种改进的版本，最新的一个是Inception-v4；
VGGNet (2014)：ILSVRC 2014的第二名是Karen Simonyan和 Andrew Zisserman实现的卷积神经网络，现在称其为VGGNet。它主要的贡献是展示出网络的深度是算法优良性能的关键部分。他们最好的网络包含了16个卷积/全连接层。网络的结构非常一致，从头到尾全部使用的是3x3的卷积和2x2的汇聚。他们的预训练模型是可以在网络上获得并在Caffe中使用的。VGGNet不好的一点是它耗费更多计算资源，并且使用了更多的参数，导致更多的内存占用（140M）。其中绝大多数的参数都是来自于第一个全连接层。后来发现这些全连接层即使被去除，对于性能也没有什么影响，这样就显著降低了参数数量。；
ResNets (2015)：残差网络（Residual Network）是ILSVRC2015的胜利者，由何恺明等实现。它使用了特殊的跳跃链接，大量使用了批量归一化（batch normalization）。这个结构同样在最后没有使用全连接层。读者可以查看使用Torch重现网络的实验；
DenseNet (August 2016)：由 Gao Huang 等人发布，全称是 Densely Connected Convolutional Network，特点是从头到尾都是跨层全连接（每一层都是以前馈方式连接到相隔的一层），读者可以查看使用Torch重现网络的实验；

参考资料

本文的核心内容：YJango的卷积神经网络——介绍
强烈推荐阅读：Machine Learning is Fun! Part 3: Deep Learning and Convolutional Neural Networks 中译版地址
CNN的直观介绍：An Intuitive Explanation of Convolutional Neural Networks（文末的参考文献也很不错）
CS231n学习笔记 Lecture 5. Convolutional Neural Networks
机器之心公众号文章深度 | 从入门到精通：卷积神经网络初学者指南

你可能感兴趣的:(深度学习,卷积神经网络,前向传播,反向传播,CNN,图像识别)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
怎么起诉借钱不还的人？怎样起诉欠款不还的人？影子爱学习
怎么起诉借钱不还的人？怎样起诉欠款不还的人？如果遇到难以解决的法律问题，我们可以匹配专业律师。例如：婚姻家庭（离婚纠纷）、刑事辩护、合同纠纷、债权债务、房产（继承）纠纷、交通事故、劳动争议、人身损害、公司相关法律事务（法律顾问）等咨询推荐手机/微信:15633770876【全国案件皆可】借钱不还起诉对方需要哪些资料起诉欠钱不还的，一般需要的材料包括以下这些：借据、收据、欠条、付款凭证等证据，以及向
直抒《紫罗兰永恒花园外传》雷姆的黑色童话
没看过《紫罗兰永恒花园》的我莫名的看完了《紫罗兰永恒花园外传》，又莫名的被故事中的姐妹之情狠狠地感动了的一把。感动何在：困苦中相依为命的姐妹二人被迫分离，用一个人的自由换取另一个人的幸福。之后，虽相隔不知几许依旧心心念念彼此牵挂。这种深深的姐妹情谊就是令我为之动容的所在。贝拉和泰勒分别影片开始，海天之间一个孩童凭栏眺望，手中拿着折旧的信纸。镜头一转，挑灯伏案的薇尔莉特正在打字机前奋笔疾书。这些片段
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
398顺境，逆境戴骁勇
2018.11.27周二雾霾最近儿子进入了一段顺境期，今天表现尤其不错。今天的数学测试成绩喜人，没有出现以往的计算错误，整个卷面书写工整，附加题也在规定时间内完成且做对。为迎接体育测试的锻炼有了质的飞跃。坐位体前屈成绩突飞猛进，估测成绩能达到12cm，这和上次测试的零分来比，简直是逆袭。儿子还在不断锻炼和提升，唯恐到时候掉链子。跑步姿势在我的调教下，逐渐正规起来，速度随之也有了提升。今晚测试的50
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
2022现在哪个打车软件比较好用又便宜实惠的打车软件合集高省APP珊珊
这是一个信息高速传播的社会。信息可以通过手机，微信，自媒体，抖音等方式进行传播。但同时这也是一个交通四通发达的社会。高省APP，是2022年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码777777，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。高
2022-11-17 无奇君
又去了一次社康，这次是急性支气管炎……太难了。半夜就猛咳，天天咳醒，还好他戴海绵耳塞睡吵不到他，要不然对他来说也是种煎熬。一累也会猛咳，希望这次是最后一次吃药，吃完就好。又想把头发剪短了，顺便染个色。可是刚刚去看人家还没开门，不是休息日老板好佛系。理发店是个夫妻店，一年多前刚搬来的时候老板还没对象呢，当时聊天老板就说希望能找个对象一起两个人守着店都比上班强。不久后再去他已经有对象了，而且在店里帮忙
傍晚小罗琳
鸟叫声在小区那边，密密稠稠，轻快而明亮，它们是归巢前互道晚安呢！金色的黄昏洋洋洒洒地飘落在房屋上，给它们镀上了一层淡淡的金边。一到黄昏，没有一个地方不是热闹的，街上的车慢慢多起来，出来散步的人也三五成群，谈笑风生。狗狗们似乎也闷坏了，撒欢地你追我赶，尽管小雨刚停，但它们的热情不减，叫着跑着，好不热闹。潮湿的空气弥漫着醉人的芬芳，楼下的杜鹃花也欣欣然张开了嘴，火红的花瓣张扬地舞动着，鲜艳欲滴，花瓣似
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
和自己结婚，是一种怎样的体验只如初见_2020
一个17岁谈恋爱，19岁结婚，然后离了三次婚的女人，站在台上说：“现在我结婚了，和那个一直以来，真正想在一起的人结婚了，那个人就是我自己。”她说，在我9岁前，我已经在二十几个寄养家庭中待过。我从童年到成年，就只有一个目标，不要被落下。而我实现这一目标的方式就是，我要结婚。我第一次的结婚对象，是我17岁时遇到的人。我们两年之后结了婚，当时我19岁。他是个非常好的人，来自于非常棒的家庭，他是工商管理硕
厉国刚：新闻学与传播学到底有何区别微观大道
厉国刚：新闻学与传播学到底有何区别头几天，有人在知乎上问我：新闻学与传播学到底有何区别。他是一位想要跨专业考研的学生，对新闻传播学学科可谓了解甚少，甚至一头雾水，想要让我帮他解释解释。在研究生学硕层面，新闻传播学是一级学科，分成新闻学、传播学这两个二级学科。有些高校，还自设了广告学、出版发行学等其他二级学科，但从官方角度，新闻传播学一级学科下，正统的就是那两个二级学科。招生时，一般会按一级学科招，
TDengine 签约前晨汽车，解锁智能出行的无限潜力涛思数据（TDengine） tdengine 汽车大数据
在全球汽车产业转型升级的背景下，智能网联和新能源技术正迅速成为商用车行业的重要发展方向。随着市场对环保和智能化需求的日益增强，企业必须在技术创新和数据管理上不断突破，以满足客户对高效、安全和智能出行的期待。在这一背景下，前晨汽车凭借其在新能源智能商用车领域的前瞻性布局和技术实力，成为行业中的佼佼者。前晨汽车采用整车数据采集和全车数据打通策略，能够实时将数据推送至APP端客户。然而，这导致整体写入和
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
为什么瘦子很难增胖？我的狗毛毛
我是个标准的瘦子，168，100斤。用一句通俗的话来讲，我连马甲线都瘦出来了（体脂含量比较低）。但是我反而很羡慕那些比较丰满的女人，我的理想是再增重十五斤，练成前凸后翘的魔鬼身材。为此我开始纠正自己不规律的作息，吃高热量的食物，减少运动量，能坐着绝不站着，能躺着绝不坐着。但是结果却没有丝毫变化。我一直很苦恼，直到最近在网上看到一个视频，英国的某个研究机构做了一个实验，想要知道瘦子能否在高热量的食物
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
生于八十年代--我的姐姐自南向北
姐姐大我四岁，幸亏有了她，才有了我。要是头一个是男孩，估计在家里就是另一个孩子了。在我儿时的记忆里，姐姐是一下子蹦出来的，为什么这么说？因为在我五六岁前的印象里是没有她的，五六岁后就突然出现在了我家。上学前的那段时间我俩一直在一起，母亲白天上班，把午饭准备好后，就出门了。屋里就留下两个孩子，由着我们在田间地头，屋前河边到处转悠，现在想来是危险至极，但是在当时却也没有旁的办法。生活是第一位的，父亲在
2022-12-25 罗平凤a98
让自己优秀起来吧睡觉前对今年的复盘。这一年有的变化是什么呢？不自知的开始难受。今年是我长这么大以来最难受，也将是我最难忘的一年吧！内卷到将近步入抑郁的一年。坚持了八年的工作在这个疫情情况下步入了进退两难的地步。再次回头才发现一直都在做着单线的收资，效益好就不太内卷。不好，那这一年就是坐着动荡的过山车，心惊胆战。这活法是不是太过于被动了？？上有老下有小，关键压力都在这个中年期体现出来了，回头看看自己
2021-09-13一切向好发展昀妡
今天，一位学员在群里发了一条求助信息。问题是：一个学生小男孩3年级了，学习态度不端正不认真，也不和老师家长沟通，怎么办？我正好看到了这条消息，便加了她的微信。我问她是否方便电话沟通。在征求学员的同意后，我和她电话沟通了10分钟，给了她一些建议。通过这件事，我看到了自己积极主动的一面。之前，我总说自己消极被动，但其实，问题的根源在于目标不清晰。如果知道方向，还是会突破心理障碍往前走。比如，陌生感召。
2023-08-08 2023梦启支教团张牧泽
学汉字历史，行传统书法——中国矿业大学梦启支教团梦启三班开展书法文化课7月20日上午8时，中国矿业大学梦启支教团在贵州省金沙县西洛街道彩虹小学开展了“书法文化”课程。该课程意在向孩子们传授汉字演变的相关知识，围绕书法发展历史讲解不同时期的字形字体特点。此课程由梦启支教团成员王耀民讲授，梦启三班全体成员参加。中国文字的发展有数千年的历史，从早期雏形的象形文字到殷商时期的甲骨文、金文，再到西周、秦朝的
春雨 · 心境 jinlinglq
春捂秋冻，谁都知晓。清明前，南京的气温逼近30℃，这样就不能再去“捂”了，否则就会让人怀疑你身上穿的真是租来的了。可是，一场清明时节的春雨又让爬高的温度如过山车般地下降，今天气温已然呈个位数了。昨日在家，我还说起南京的俗语：三月三，冻得把眼翻。意思是，即使到了农历三月三，南京还是会有低温来临。母亲更正道：错了，应该是“三月三，冻得把衣翻”。农历的三月三要是冻得把眼翻，那还得了？其实是把收起的冬衣从
2024.8.22 Python，链表两数之和，链表快速反转，二叉树的深度，二叉树前中后序遍历，N叉树递归遍历，翻转二叉树 RaidenQ python 链表开发语言
1.链表两数之和输入：l1=[2,4,3],l2=[5,6,4]输出：[7,0,8]解释：342+465=807.示例2：输入：l1=[0],l2=[0]输出：[0]示例3：输入：l1=[9,9,9,9,9,9,9],l2=[9,9,9,9]输出：[8,9,9,9,0,0,0,1]昨天的这个题，用自己的办法写的麻烦的要死，然后刚才一看chat归类的办法，感觉自己像个智障。classListNode
骑昆明到北海—119 砚山县 61清风i
从十年前第一次长途骑行青海湖开始每年一次长途骑行看风景，尝各地美食，探访异域文化，记录途中美食美景美事，已逐渐形成习惯。每年春季详细规划好线路，夏季出行，2020年因为疫情迟迟不能确定线路和行程。总算到了暑期疫情逐渐消失，规划了50多天的云南昆明—广西北海计划。本次行程从云南昆明出发到广西北海市结束，五十一天骑行二千多公里线路昆明-官渡古镇-环滇池--澄江市一抚仙湖—路居镇--江川区--通海县—龙
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。