斯外戈的小白

pytorch_lesson16.2 架构对学习/鲁棒性的影响(VGG16复现+感受野+平移不变性)+架构对参数量的影响(1*1卷积核+分组卷积与深度分离卷积+NiN网络复现）

提示：仅仅是学习记录笔记，搬运了学习课程的ppt内容，本意不是抄袭！望大家不要误解！纯属学习记录笔记！！！！！！

文章目录

前言
一、架构对学习能力/鲁棒性的影响
- 1 深度
- - 1.1 困难与实践
  - 1.2 VGG16的复现
  - 1.3 原理与研究方向
- 2 感受野
- - 2.1 认识感受野
  - 2.2 感受野的性质
  - - （1）深度越大，感受野越大，池化层放大感受野的效率更高
    - （2）放大感受野，是否有极限?
    - （3）关注中心，模糊周围
  - 2.3 扩大感受野:膨胀卷积
  - 2.4 感受野尺寸的计算
- 3 平移不变性
二架构对参数量/计算量的影响
- 1 卷积层
- - 1.1 参数量计算
  - 1.2 大尺寸卷积核vs小尺寸卷积核
  - 1.3 1*1 卷积核
  - 1.4 减少参数数量：分组卷积与深度分离卷积
- 2 全连接层
- - 2.1 从卷积到全连接层
  - 2.2 代替全连接层:1x1卷积核与全局平均池化(GAP)
- 3 NiN网络的复现

前言

在自建架构时，我们需要时刻牢记模型评估的三角:效果、效率(运算速度)、可解释性。对于深度学习架构而言，可解释性几乎可以忽略不计，但是如果我们能够使用可解释的方式对数据进行处理，我们也不会刻意避开。

一、架构对学习能力/鲁棒性的影响

在讲解AlexNet时，我们已经说明，“小卷积核、多通道、更深层”的规则在实践中被证明是有效的，这个规则可以一定程度上保证我们架构的效果，但围绕这种架构的疑问还很多，比如，为什么这样的架构会有效?能够严谨证明吗?如果深度会更有效，我能够自由修改/增删层的结构吗?假设更深的架构有效，我们能否承担深层架构的训练成本呢?在自建卷积网络的时候，这些都是我们要考虑的因素。接下来，我们就从架构的执行效率以及学习能力两个方面进行更深入的说明。

1 深度

1.1 困难与实践

更深的网络会展现出更强大的学习能力，这是深度学习领域的一个普遍认知，因此在建立自己的神经网络时，一个常用的思路就是“加深现有模型的深度”来提升模型效果。

理想是美好的，但在追寻“深度”的路上，我们总是会遭遇理论和实践上的重重困难。第一个难以忽视的问题，就是输入图像的尺寸会限制我们可以选择的深度。即便你知道继续加深会获得更好的效果，我们能够建立的网络远远没有想象中的那么深。

在卷积神经网络由浅至深的过程中，特征图的整体趋势是缩小的。如果最终进入FC层的特征图太小，则会损失掉过多的信息，如果进入FC层的特征图太大，则会导致FC层的参数量过于巨大，因此在特征图进入最终的全连接层(FC层)之前，其最小尺寸大约需要被控制在5x5-9x9之间，常见尺寸为5x5，7x7， 9x9。不巧的是，卷积层和池化层都是特征图尺寸杀手。

一个不重叠的池化层可以将特征图的宽高折半，而任意卷积层，只要步长为2，也可以轻松将特征图的宽高折半。以224x224尺寸的图像为例，只要池化层和步长为2的卷积层出现5次（2**5=32， 32*7=224），特征图尺寸就会变成7x7，不再具备“追求深度”的空间。池化层的各项相关参数很少小于(2,2)，因此我们只能依赖卷积层来控制特征图尺寸的缩小速度。但卷积层的选项也没有想象中那么丰富。

首先，为了特征图尺寸不“折半”，步长只能是1。同时，根据计算机视觉的惯例，卷积核的尺寸只能在 3x3，5x5，最多7x7之间进行挑选，而卷积核的尺寸在特征图计算公式中是在分子上被减去的数，因此其他参数不变时，卷积核越大，生成的特征图尺寸越小。

所以为了深度，卷积核最好是保持小尺寸。然而，卷积核很小的时候，“填充”就无法被设定得太大。在 PyTorch中，池化层的padding的参数值必须小于池化核尺寸的1/2，否则程序会报错、无法运行(以下图为例，对池化而言，kernel3padding2以及kernel3padding3的组合几乎没有意义，只有当padding小于1/2kernel的时候，池化核才会捕捉到足够的信息。因此池化层在实践中，99%的情况下都不会使得特征图变大)。卷积层的padding参数值虽然不受程序强制限制，但一般也会设置为至少是小于卷积核尺寸，当kernel=padding时，卷积层会增加不必要的计算，甚至会单纯增加噪音(如kernel3padding3的情况)。

所以不难发现，在追求“深度”的过程中，卷积层的参数看似选择多多，其实处处受限。在卷积核尺寸、填充、步长的限制下，我们常见的特征图尺寸变化其实只有以下三种:

1、宽高分别折半、或缩小更多:当步长为2以上，或者卷积核较大时，可以实现大幅度缩小特征图的尺寸。例如AlexNet第一个卷积层，利用步长4，11x11的卷积核，就直接将宽高缩小至原来的1/4。

2、不使用池化层，利用填充与卷积核尺寸的搭配，令特征图每经过一次卷积层，就缩小2个或4个像素，例如:

3、利用填充与卷积核尺寸的搭配，令特征图每经过一次卷积层，尺寸不变，将缩小特征图的工作完全交给池化层来做，例如:

还有一种很罕见的操作，就是令特征图在经过卷积层之后变大，不难注意到，这就是padding的取值大于1/2卷积核的情况:

但这意味着给特征图增加了噪音，也增加了更多无效的计算。

可见，从加深深度的角度来说，我们能够做的就是“递减2或4”，或者“保持特征图不变、并将减小特征图的工作较给池化层去做”这两种选项。在输入的图像的结构都为(128，1，224，244)，且每层输出的特征图数目相同，且进入FC层之前的特征图尺寸被缩减至相似大小(7x7，8x8)的前提下，逐层递减的架构(1)与保持特征图不变的“重复”架构(2)分别如下:

在Fashion-MNIST数据集上，两者在训练准确率上可以达到的平均极限几乎没有差别(都接近99%)，但重复架构的鲁棒性会更好，在测试集上的表现会更高。

VGGNet的论文中提出了6种重复架构，其中每重复几个卷积就会跟一个最大池化层，这种“n个卷积+池化”的结构在VGG中被称之为“块”(block)。在深度卷积网路中，我们常常会划分“块”，VGG是按照特征图尺寸的变化来进行划分(每池化一次，就分一次块)，6种架构都有五个块。

受启发于VGG架构，在过去数年的研究中，人们通过实验发现了这样的结论:在不改变原始卷积层输入输出机制的前提下，增加卷积层的数目来增加深度，会很快让模型效果和性能都达到上限。深度并不能高效提升模型的效果，需要先降低模型的训练成本，才能够追求更深的神经网络。如果想要通过“加深” 卷积神经网络来实现网络效果的飞跃，那必须是从16层加到160层，而不是从16层加到19层。事实上，在2014年后的ILSVRC上，赢得冠军的网络架构变得越来越复杂，深度也越来越深，在2017年ILSVRC闭幕之前，网络深度大约停留在了220层左右，这是得益于研究者们发现了更高效地提升深度的方法。

50x50的图像而言，若追求测试准确率在90%以上，只需要小于20层的神经网络就足够了。

1.2 VGG16的复现

输入→(卷积x2+池化)x2 →(卷积x3+池化)x3 → FC层x3 →输出

其中每组卷积+池化算一个block。同时，架构图中没有显示出来的内容包括:
1、除了输出层外，所有的激活函数都是ReLU函数；
2、最后三个全连接层中的前两个全连接层前有Dropout层，p=0.5

import torch
import torch.nn as nn
from torchinfo import summary


data = torch.ones(10, 3, 224, 224)

class VGG16(nn.Module):
    def __init__(self):
        super(VGG16, self).__init__()

        #block1
        self.conv1 = nn.Conv2d(3, 64, 3,padding=1) #(224+2-3)/1 + 1 = 224
        self.conv2 = nn.Conv2d(64, 64, 3, padding=1 )
        self.pool1 = nn.MaxPool2d(kernel_size=2, stride=2) # 224/2 =112

        #block2
        self.conv3 = nn.Conv2d(64, 128, 3, padding=1) #112+2-3+1 =112
        self.conv4 = nn.Conv2d(128, 128, 3, padding=1)
        self.conv5 = nn.Conv2d(128, 128, 3, padding=1)
        self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2) #112/2= 56

        #block3
        self.conv6 = nn.Conv2d(128, 256, 3, padding=1)
        self.conv7 = nn.Conv2d(256, 256, 3, padding=1)
        self.conv8 = nn.Conv2d(256, 256, 3, padding=1)
        self.conv9 = nn.Conv2d(256, 256, 3, padding=1)
        self.pool3 = nn.MaxPool2d(kernel_size=2, stride=2) #56/2 = 28

        #block4
        self.conv10 = nn.Conv2d(256, 512, 3, padding=1)
        self.conv11 = nn.Conv2d(512, 512, 3, padding=1)
        self.conv12 = nn.Conv2d(512, 512, 3, padding=1)
        self.conv13 = nn.Conv2d(512, 512, 3, padding=1)
        self.pool4 = nn.MaxPool2d(kernel_size=2, stride=2) #28/2= 14

        #block5
        self.conv14 = nn.Conv2d(512, 512, 3, padding=1)
        self.conv15 = nn.Conv2d(512, 512, 3, padding=1)
        self.conv16 = nn.Conv2d(512, 512, 3, padding=1)
        self.conv17 = nn.Conv2d(512, 512, 3, padding=1)
        self.pool5 = nn.MaxPool2d(kernel_size=2, stride=2) #14/2 =7

        #block6
        self.drop1 = nn.Dropout(0.5)
        self.fc1 = nn.Linear(7*7*512, 4096)
        self.drop2 = nn.Dropout(0.5)
        self.fc2 = nn.Linear(4096, 4096)
        self.fc3 = nn.Linear(4096, 1000)
        self.output = nn.Softmax(dim=1)

    def forward(self, x):
        #block1
        x = torch.relu(self.conv1(x))
        x = torch.relu(self.conv2(x))
        x = self.pool1(x)

        #block2
        x = torch.relu(self.conv3(x))
        x = torch.relu(self.conv4(x))
        x = torch.relu(self.conv5(x))
        x = self.pool2(x)

        #block3
        x = torch.relu(self.conv6(x))
        x = torch.relu(self.conv7(x))
        x = torch.relu(self.conv8(x))
        x = torch.relu(self.conv9(x))
        x = self.pool3(x)

        #block4
        x = torch.relu(self.conv10(x))
        x = torch.relu(self.conv11(x))
        x = torch.relu(self.conv12(x))
        x = torch.relu(self.conv13(x))
        x = self.pool4(x)

        #block5
        x = torch.relu(self.conv14(x))
        x = torch.relu(self.conv15(x))
        x = torch.relu(self.conv16(x))
        x = torch.relu(self.conv17(x))
        x = self.pool5(x)

        #block6
        x = x.reshape(-1, 7*7*512)
        x = self.drop1(x)
        x = torch.relu(self.fc1(x))
        x = self.drop2(x)
        x = torch.relu(self.fc2(x))
        out_put = self.output(self.fc3(x))
        return out_put

vgg= VGG16()
vgg(data)

summary(vgg, input_size=(10, 3, 224, 224))

（把老师的结果贴来了，自己的截屏截不全）

1.3 原理与研究方向

1、在同样的资源支持下，深度网络解决复杂问题的能力高于浅层网络。深度网络展现出对复合函数的拟合能力，更深的网络能够拟合更复杂的复合函数，而浅层网络的这种能力却不明显。

2、深度网络可以快速降低优化算法进入一个很大的局部最小值的概率，这或许能够解释为什么深度网络的效果更好。

从数学上可以推断，神经网络的深度越深时，权重空间更加复杂，但损失函数的众多局部最小值的大小将会变得比较接近(鞍点会变平、整个函数的图像会变得平滑)，并且随着深度加深，局部最小值的数量会越来越少、数值也越来越接近，这就降低了优化算法走入一个值很大的局部最小值的可能性。同时，寻找全局最小值是没有意义的，因为在实际应用神经网络时，挣扎着找全局最小值一般都会走入过拟合的结局。

3、更深的网络能带来更大的感受野，而更大的感受野能带来更好的模型效果
这几乎是卷积神经网络的学术界公认的事实，虽然人们还没有从理论层面对此进行证明，但从实践的结果来看，感受野、深度与模型效果之间的相关性是确实存在的。接下来，我们就来认识感受野。

2 感受野

2.1 认识感受野

由于卷积神经网络有“稀疏交互”的特性，CNN中的神经元只受到原始图像上一部分数据的影响，而这部分数据其实就是神经元在生成过程中、使用卷积操作时扫描到的那部分原始数据，这部分数据所在的区域也就是感受野。由于大多数时候，图像和卷积核都是正方形，如果padding=0，步长为1，因我们可以只考虑行/列中的一个维度来看感受野的变化。

如果是一张巨大的图像，有4个卷积层，每个卷积层的步长都为1，kernel_size=3x3，则有:

对于卷积层4上的任意神经元(像素)而言，它的感受野就是原始图像上的9x9的区域，仿佛最下面一层的神经元就是光源，而图像上的感受野就是神经元的光能够照射到的地方。不难发现，随着深度的加深，神经元上的感受野会越来越大，这意味着这个神经元上所携带的原始数据的信息会越来越多。而由于卷积神经网络是稀疏交互的，为了让神经元在做出判断之前能够获取尽量多的信息，在被输入到FC层之前的感受野越大越好。理论研究证明，一个表现优异的模型在FC层前的感受野一定是非常大的，巨大的感受野是模型表现好的必要条件。和“深度”一样，通常我们认为，较大的感受野意味着较好的模型效果，但稍微增加一些感受野的尺寸，并不能对整个模型的预测效果带来巨大的改变。

2.2 感受野的性质

（1）深度越大，感受野越大，池化层放大感受野的效率更高

不难发现，下面这张图就是每次将特征图尺寸缩小2个像素的递减架构，在经历4个卷积层后，图像的尺寸由22x22下降到了14x14，感受野尺寸为9x9。

如果使用VGG中的重复架构使用的参数，即每个卷积层都使用kernel_size=3，padding=1的架构，且每 3个卷积层后跟一个(2,2)参数的最大池化层，在4个卷积层之后我们可以得到下图：

注意:每个卷积层的padding参数影响的是上一层输出的特征图。可以看到，重复架构中，经过4层卷积层和1个池化层之后，图像的尺寸下降到了11x11，且第四个卷积层生成的特征图上的神经元的感受野达到了12x12的尺寸，比递减架构相同卷积层下的感受野要大。在两种架构中，只要卷积核的尺寸保持3x3，那每经过一个卷积层，感受野的尺寸实际上只会增加2，但池化层在将特征图尺寸减半的同时，却能够将感受野的宽和高都扩大一倍。池化层的存在令重复架构放大感受野的效率更高，这让重复架构更有优势。

（2）放大感受野，是否有极限?

事实上，感受野的尺寸没有上限。

超出图像的部分在最终的特征图的像素来看是什么样的呢?就相当于是没有值，全为0，表现在图像上就是黑框。对于各个卷积层上的神经元们来说，他们的感受野会有如下差别:

那这样做，有什么意义呢?当感受野大小超出图像大小时，增加黑框不就是增加噪音吗?为什么要让感受野越来越大，让图像信息越缩越小呢?这和感受野的第三个性质有关。

（3）关注中心，模糊周围

卷积神经网络的感受野也是一样。对于特征图来说，每个神经元所捕捉到的感受野区域不同，但这些区域是会有重叠的，并且很好理解的是，越是位于中间的像素，被扫描的次数越多，感受野重叠也就会越多。

对整个特征图来说，重叠越多的部分，信息就越饱满，“看得就越清晰”，而重叠较少的部分，信息就比较稀疏，因此就会“模糊”。因此，位于图像中间的像素有更多可以影响最终特征图的“路径”，他们对最终特征图的影响更大，对卷积网络的分类造成的影响也会更大。

因为中间清晰两边模糊的性质，也因为有效感受野的存在，在卷积神经网络开始分类之前，我们必须尽量让图像的有效信息集中在感受野的中心，这些有效信息越集中，感受野就越能“看清”这些信息，越能提取出有效的特征。总之，使用远远超出图像尺寸的感受野，而将图像信息“锁”在感受野中心，让本来应该“模糊”的部分全都被黑边所替代，就是最有效的做法。由于现在还无法精确地计算出有效感受野的大小，理论上来说感受野更大会更好。唯一的例外就是，你在图像中想要识别的对象在图像的边缘，而巨大的干扰项却在图像中间的时候。此时，你把感受野放得越大，干扰就会越大。

2.3 扩大感受野:膨胀卷积

有数个方法可以扩大感受野:
1、加深卷积神经网络的深度，理论上来说，每增加一个卷积层，感受野的宽和高就会按照卷积核的尺寸-1线性增加；
2、使用池化层或其他快速消减特征图尺寸的技术；
3、使用更加丰富的卷积操作，如膨胀卷积dilated convolution、残差连接等等。

膨胀卷积又叫做空洞卷积，它通过在感受野上使需要计算点“膨胀”的方式来“扩大”卷积核可以扫描的区域。所谓膨胀的概念如下图所示。

在感受野上，需要参与卷积计算的任意一个像素都是计算点。以计算点为中心向外“扩充”像素点的行为就叫做“膨胀”。注意，膨胀和填充非常相似，但膨胀只是扩大以计算点为中心的某个面积，并不会改变计算点相邻像素点的值，填充则是需要对计算点相邻像素点的值进行修改。以计算点为中心，膨胀率 (dilation rate)为1时，计算点自身就是全部面积。膨胀率为2时，在计算点周边扩充一圈像素，当膨胀率为3时，在计算点周边填充2圈像素，以此类推。膨胀卷积就是在每个参与卷积计算的计算点上做“膨胀”操作，让计算点与计算点之间出现“空洞”，并跳过空洞进行计算的卷积方式。描述上来说有些难以理解，我们来看图:

膨胀率为1时，3x3的卷积核所对应的感受野大小也是3x3(绿色区域)，全部9个被感受野所包括的像素点都会和卷积核上的值执行卷积操作，并得到特征图中的像素点。

当膨胀率为2时，每个计算点所覆盖的面积都会向外拓展一圈，将原来的计算点向右向下“挤”，构成如图所示的感受野。此时，卷积核的尺寸为3x3，但感受野的尺寸为5x5，感受野中白色的格子都是计算点“膨胀”的结果，不参与计算，绿色的格子依然按照无膨胀时的规则与卷积核进行计算。

当膨胀率为3时，计算点向外膨胀的像素值为2圈，感受野的大小则变成7x7，但执行计算的计算点数依然是9个。

很明显，膨胀卷积会改变输出的特征图的尺寸，其计算公式如下:

通过膨胀卷积，我们可以在不增加卷积核参数的情况下放大感受野。不过这里有一个很大的问题:虽然看上去感受野的面积是被放大了，但是跳过其中的像素点不进行计算，真的算是放大了本应该用来捕获信息的感受野吗?这样的放大是有效的吗?从直觉来看，这样做应该会产生非常多的信息损失，要了解膨胀卷积真正的力量，还需要将多个卷积层连起来考虑。

对于没有膨胀的原始卷积，在第三层卷积层的特征图上，任意两个相邻的神经元的感受野如下所示。其中绿色是绿色神经元的感受野，黄色是黄色神经元的感受野，橙色是两个神经元在各层上感受野的交叉部分。不难看出，对于普通卷积，相邻神经元的感受野大概率是重复的，两个神经元的感受野合起来尺寸有8x8的大小，而其中7x7的部分都是重复的。

假设从第一个卷积层开始，我们就采用dilation=2的设置，在第三个卷积层生成的特征图上，相邻的两个神经元所涉及到的计算点如图所示:每次进行计算时，都是上一层不相邻的9个像素被扫描到。虽然在生成单个神经元时，上一层的特征图上留下了不少未计算的空隙，但相邻的神经元却很好地补上了这些没有被计算的部分，使得相邻两个神经元之间没有重复进行扫描。此时，两个相邻神经元的感受野合起来就有14x14的大小，比起没有膨胀卷积时的感受野面积大了约3倍左右。这个性质可以被很好地利用，当我们将膨胀率调大，并且让膨胀卷积层与普通卷积层串联使用时，单个像素的感受野可以被持续放大 (这种情况下，两个像素共同的感受野自然更大了)。如下图所示:

在这个图中，我们第一层卷积层是普通卷积(膨胀率为1)，因此这一层的每一个像素点都对应原始图像中3x3的面积。第二个卷积层我们使用膨胀率=2的卷积，即每个计算点之间相隔1个像素。第三个卷积层我们让膨胀率=6，即每个计算点之间相隔5个像素，可以看到，在第三个卷积层输出的特征图上，一个像素能够覆盖到原始图像的感受野尺寸变成了19x19。如果再结合池化层进行使用，那膨胀卷积放大感受野的性质会更加明显。

2.4 感受野尺寸的计算

对于第L个卷积层/池化层输出的特征图而言，假设卷积核尺寸为正方形、输入架构的图像尺寸也为正方形，则该图上任意一个神经元的感受野大小为：

注意，全连接层一般不计算感受野，因为全连接层的神经元就是前一个卷积层输出的特征图上的全部神经元拉平后的结果，因此全连接层的感受野就与最后一个卷积层上输出的特征图的感受野一致。

3 平移不变性

你认为下面的图像中是同一只猫咪吗?大部分的人会认为下面的图像中只是花纹相近、姿势相仿的猫咪，而不是同一只猫。但对卷积神经网络来说，下面的图像才更像是“同一只猫”。对于Narnia的照片来说，当训练集中只有一张猫脸正面照时，卷积网络很难识别出各种仰头、侧躺、侧脸的生物是什么。但下面这张图像中，虽然画风、背景、甚至猫咪的品种都发生了变化，但图中的物体位置、像素排列(轮廓、颜色)等信息有很高的相似度，因此更容易被判断成是“同一只猫”。

人类和卷积网络对图像的“理解”方式不同，导致我们对同样的图像有不同的判断。在这种情况下，假设我们在相似背景中绘制一个颜色类似的花瓶，很可能也会被模型判断成是“猫”，假设我们将训练数据的图像水平翻转，模型反而无法判断这就是“猫”了。此时，模型就是处于过拟合状态之中，只认识“自己见过的东西”，泛化水平较低，鲁棒性较低。

在视觉领域，有非常多从不同角度定义的不变性，其中基础的不变性有4种:平移不变性(Translation Invariance)、旋转/视野不变性(Rotation/ViewPoint Inviariance)、尺寸不变性(size Inviarance) 与明度不变性(Illumination Invariance)，其他常见的不变性包括镜面不变性(镜面翻转图像)，颜色不变性等。

大部分深层卷积网络的架构自带一定的“平移不变性”，只要对象的轮廓一致，无论对象出现在图像的哪个位置，卷积网络都能够判断出来。这是怎么实现的呢?来看下面这张图:

原始图像是一张字母C的图像，绿色区域就是字母C的像素。在卷积层中，我们使用4x4的卷积核对原始图像进行扫描，并在卷积层之后跟上核尺寸为2x2的最大池化层。不难发现，当我们将字母C整个向下平移一个像素时，虽然卷积层在捕捉特征时将字母C的特征信息放置在了不同的神经元上，如果我们将字母C向右平移少许像素，很自然的，在卷积层后的特征图上，相关信息就会被放置在不同的神经元上。然而，对于大部分图像而言，有效信息较为集中的区域的像素值会更大，在卷积操作后得到的特征图上的值也会更大，这是最大池化层能够有效的基础。因此，无论有效信息位于特征图的什么位置，在经过 (也许不止一个)最大池化层之后，有效信息都能够被顺利筛选出来，也因此，在卷积神经网络中，关键像素被平移后对模型整体准确率的影响相对较小。

不难发现，在这个过程中，卷积层的“无差别扫描”起到了重要作用，但真正让信息保持不变、不产生损失的其实是池化层。一些观点认为，池化层的存在是CNN自带一定的平移不变性的主要理由，但有些观点正相反，但无论如何，公认的是:更深层的卷积网络的平移不变性更强。下面这篇博文很好地完成了卷积网络在不同平移程度以及不同深度下的平移不变性的实验:https://divsoni2012.medium.com/tra nslation-invariance-in-convolutional-neural-networks-61d9b6fa03df。

简单说说这篇博文的内容。在这篇博文中，作者持有两个重要观点:

1、CNN的平移不变性只能够应对“微小的平移”，当物体横向或纵向平移的像素过多时，CNN的平移不变性会衰减。

2、卷积+池化层的叠加可以增强CNN的平移不变性(更深的网络拥有更强的平移不变性)，同时增强模型的鲁棒性。

对于图像数据而言，可用的数据增强技术数不胜数，例如:

如果做了数据增强，模型可能拥有了各种的不变性，那是否就高枕无忧了呢?并不是如此。为模型引入不变性的确很有用，但也会有一些尴尬的情况。例如，在卷积神经网络不断将特征图缩小的过程中，像素之间的“位置”信息是会逐渐损失掉的，当这些信息进入全连接层之后，网络就再也没有“相对位置”的概念了，因此在人脸识别中，平移不变性会让卷积神经网络将下面两张图像都判断成人脸，但左侧明显只是一些元素的堆积，并不是真正的人脸。大多数时候平移不变性会提升模型的效果，但对于密集任务 (需要对每个像素进行预测的任务)而言，平移不变性可能导致灾难。

二架构对参数量/计算量的影响

在自建架构的时候，除了模型效果之外，我们还需要关注模型整体的计算效率。深度学习模型天生就需要大量数据进行训练，因此每次训练中的参数量和计算量就格外关键，因此在设计卷积网络时，我们希望相似预测效果下，参数量越少越好。为此我们必须理解卷积中的每层会如何影响模型整体的参数量和计算量。

模型参数是需要学习的参数，例如权重和常数项，任何不需要学习、人为输入的超参数都不在“参数量”的计算范围内。对于卷积神经网络中的任意元素(层或函数)，有两种方式影响模型的参数量:
1、这个层自带参数，其参数量与该层的超参数的输入有关
2、这个层会影响feature map的尺寸，影响整体像素量和计算量，从而影响全连接层的输入

1 卷积层

1.1 参数量计算

个卷积网络的卷积层究竟包含多少参数量，就是由卷积核的尺寸kernel_size、输入的通道数 in_channels，输出的通道数out_channels(卷积核的数量)共同决定的。其参数量如下:

import torch
import torch.nn as nn

#K_h * K_w * C_in * C_out + C_out
conv1 = nn.Conv2d(3,6,3) #(3 * 3* 3) * 6+ 6 = 168
conv2 = nn.Conv2d(6,4,3) #(3 * 3 * 6) * 4 + 4 =220
#检查一下结果
print(conv1.weight.numel())#162
print(conv1.bias.numel())#6
print(conv2.weight.numel())#216
print(conv2.bias.numel())#4

相对的，padding以及stride这些参数，不影响卷积层的所需要的参数量:

conv3 = nn.Conv2d(4, 16, 5,stride=2,padding=1) # (5*5*4)*16 + 16
conv4 = nn.Conv2d(16, 3, 5,stride=3,padding=2) # (5*5*16)*3 + 3
print(conv3.weight.numel())#1600
print(conv3.bias.numel())#16
print(conv4.weight.numel()) #1200
print(conv4.bias.numel())#3

从卷积层的参数计算公式来看，较大的卷积核、较多的输入和输出都会对参数量影响较大，由于实际中使用的卷积核都很小，所以真正对卷积核参数有影响力的是输出和输入的特征图的数量。在较为复杂的架构中，卷积层的输出数量可能达到256、512、甚至更大的数字，巨大的数字足以让一个卷积层包含的参数达到百万级别。例如VGG16中，比较深的几个卷积层，他们的参数都在百万以上。

通常来说，如果我们希望减小卷积神经网络的参数量，那我们优先会考虑减少的就是输出的特征图数量。但随着网络加深，特征图是越来越小的，学习到更多深入的信息，特征图数量必然会增加(依照惯例，每经过一个池化层，就将特征图数量翻倍)。因此，如果希望消减卷积层的参数量，可以考虑不使用那么多卷积+池化的组合(不要那么深的深度)，如果一定要保持深度，则在第一层时就使用较小的特征图数量，例如32。

1.2 大尺寸卷积核vs小尺寸卷积核

在讲解感受野时我们曾经使用过卷积层的俯视图，假设我们有两层核尺寸为3x3的卷积层，对于第二个卷积层输出的特征图而言，一个神经元映射到原始图像上的感受野尺寸为5x5。同样的图像，假设我们使用一层5x5的卷积层，也可以得到5x5的感受野。同样的，2个3x3卷积层将10x10的特征图缩小为了 6x6，一个5x5卷积层也将特征图缩小到了6x6。可以说，在“捕获的信息量”、“压缩尺寸”这两个层次上，两个3x3的卷积层和一个5x5的卷积层获得了一样的结果。同理，我们也可以用三层3x3卷积核的卷积层替代一层7x7的卷积核，更大的卷积核亦然。

两个3x3的卷积层总共需要7万+参数，而一个5x5的卷积层却需要10万+参数。对于VGG16这种重复架构的网络而言，如果将所有的3x3卷积核都替换成5x5卷积核，那整体参数量将增加3个亿。可见，3x3的两个卷积层不仅加深了深度，一定程度上让提取出的特征信息更“抽象”、更“复杂”，同时也让参数量大幅减少。这又给了我们一个坚定使用小卷积核的理由。

1.3 1*1 卷积核

1x1的卷积核上只有一个权重，每次进行卷积操作时，该权重会与原始图像中每个像素相乘，并得到特征图上的新像素，因此1x1卷积也被叫做“逐点卷积”(Pointwise Convolution)。

1x1卷积核下的参数量为:

在实际中，1x1卷积的重要作用之一就是加深CNN的深度。1x1卷积不会改变特征图的尺寸，因此可以被用于加深CNN的深度，让卷积网络获得更好的特征表达。这个性质被论文《Network in Network》所使用，并在架构NiN中发挥了重要的作用。NiN是AlexNet诞生不久之后被提出的架构，虽然也是2014年的论文，但早于VGG之前诞生，其架构如下:

在NiN的架构中，存在着一种特殊的层:MLP layer。虽然在NiN的论文中，MLP layer是被看成是一个独立的单元来说明，但从其结构、操作和输出的特征图来看，MLP layer毫无疑问就是1x1的卷积层。 NiN是以每个3x3卷积层后紧跟2个1x1卷积层组成一个block，并重复3个block达成9层卷积层架构的网络。

1x1卷积层不会改变特征图的尺寸，这个性质虽然有用，但和使用padding的卷积层差异不是特别大。从今天的眼光来看，1x1卷积核在加深深度方面最关键的作用还是用在卷积层之间，用于调整输出的通道数，协助大幅度降低计算量和参数量，从而协助加深网络深度，这一作用又被称为“跨通道信息交互”。

可以看到，虽然最后都输出了256个相同尺寸的特征图，并且所有信息都经过了3x3的卷积核的扫描，但瓶颈架构所需要的参数量只有2.6万个，一个3x3卷积层所需要的参数却有59万个。对于百层以上的深层神经网络来说，这个参数差异足以让人放弃一些性能，也要坚持使用瓶颈设计。

1.4 减少参数数量：分组卷积与深度分离卷积

若考虑偏置，则：

不难发现，分组的存在不影响偏置，偏置只与输出的特征图数量有关。

import torch.nn as nn

conv1 = nn.Conv2d(4, 8, 3)  #(3 * 3 * 4)*8 + 8 = 296
conv1_ = nn.Conv2d(4,8,3,groups=2) # ((3 * 3 * 4)*8)/2 + 8 = 152
print(conv1.weight.numel()) #288
print(conv1.bias.numel()) #8
print(conv1_.weight.numel()) #144
print(conv1_.bias.numel()) #8

特征图数量巨大时，分组卷积可以节省非常多的参数。当表示在图像上，深度卷积所展示的链接方式为:

我们还可以将深度卷积与1x1卷积核结合使用。对输入特征图，我们首先进行深度卷积，产出一组特征图，然后再这组特征图的基础上执行1x1卷积，对特征图进行线性变换。两种卷积打包在一起成为一个 block，这个block就叫做“深度可分离卷积”(Depthwise separable convolution)，也被称为“分离卷积”(separable convolution)。对于深度可分离卷积的一个block，若不考虑偏置，则整个block的参数量为:

import torch.nn as nn

conv1 = nn.Conv2d(4, 8, 3, bias=False) #(3 * 3 * 4) *8 =228
conv_depthwise = nn.Conv2d(4, 8, 3, groups=4, bias=False)  #1/4 * (3 * 3 * 4) *8 = 72
conv_pairwise = nn.Conv2d(8, 8, 1, bias=False) # 1* 1 * 8 * 8 =64

print((conv_pairwise.weight.numel()+ conv_depthwise.weight.numel())/ conv1.weight.numel())
#0.4722222222222222

2 全连接层

全连接层的作用主要有以下两个:

（1）作为分类器，实现对数据的分类。本质上来说，卷积层提供了一系列有意义且稳定的特征值，构成了一个与输入图像相比维数更少的特征空间，而全连接层负责学习这个空间上的(可能是非线性的)函数关系，并输出预测结果。(其他可能的选择是，在卷积层后面放置一个SVM，或者放置其他机器学习算法作为分类器。)

（2）作为整合信息的工具，将特征图中的信息进行整合。全连接层能够确保所有信息得到恰当的“混合”，以保证预测的效果。

更多层，还是更多神经元?
对于CNN中的全连接层来说，在一个层上增加足够多的神经元，会比增加层效果更好。一般来说，CNN 中的全连接层最多只有3-4层(包括输出层)，过于多的层会增加计算的负担，还会将模型带入过拟合的深渊。对于小型网络，3层全连接层已是极限了。需要注意的是，在卷积层和全连接层的连接中，通常全连接的输出神经元个数不会少于输入的通道数。对于全连接层之间的连接，只要不是输出层，也很少出现输出神经元少于输入神经元的情况。对全连接层而言，更大的参数代表了更高的复杂度、更强的学习能力、更大的过拟合可能，因此对于小型网络来说，除非你的数据量庞大或数据异常复杂，尽量不使用 1024以上的参数。

2.1 从卷积到全连接层

在之前的课程中，我们使用torchinfo包中的summary来自动计算特征图尺寸，不难发现，要使用 summary函数，前提是已经建好了能够顺利运行的model，但尴尬的是，当我们不知道架构中红色箭头处应该填写什么数字时，model是不可能跑通的。那怎么在模型架构不完整的情况下，找出最后一个池化层/卷积层上输出的特征图的尺寸呢?一种简单的方法是，将Model中所有的线性层都注释掉，只留下卷积层，然后将model输入summary进行计算，但有更简单的方法，使用另一种构筑神经网路架构的方式:nn.Sequential。

nn.Sequential是一种非常简单的构筑神经网络的方式，它可以将“以序列方式从前往后运行的层”打包起来，组合成类似于机器学习中的管道(Pipeline)的结构，以此避开建立类、继承类等稍微有些抽象的 python代码。大多数深度学习课程和教材在最开始的时候就会介绍它，并且一直以它作为例子运行各类神经网络，我们来看具体的例子:

import torch
import torch.nn as nn
from torchinfo import summary

data = torch.ones(size=(10, 3, 229, 229))
#不使用类，直接将需要串联的网络、函数等信息写在一个序列里
net = nn.Sequential(nn.Conv2d(3, 6, 3),
                    nn.ReLU(inplace=True),
                    nn.Conv2d(6, 4, 3),
                    nn.ReLU(inplace=True),
                    nn.MaxPool2d(2),
                    nn.Conv2d(4, 16, 5, stride=2, padding=1),
                    nn.ReLU(inplace=True),
                    nn.Conv2d(16, 3, 5, stride=3, padding=2),
                    nn.ReLU(inplace=True),
                    nn.MaxPool2d(2))

print(net(data).shape)
#torch.Size([10, 3, 9, 9])

在较为复杂的网络架构中，我们通常利用nn.Sequential来区分网络的不同部分:例如，在普通CNN中，卷积层、池化层负责的是特征提取，全连接层负责的是整合信息、进行预测，因此我们可以使用 nn.Sequential来区别这两部分架构。以VGG16为例：

import torch
import torch.nn as nn
from torchinfo import summary

feature_capture = nn.Sequential(nn.Conv2d(3, 64, 3, padding=1),nn.ReLU(inplace=True),
                                nn.Conv2d(64, 64, 3, padding=1),nn.ReLU(inplace=True),
                                nn.MaxPool2d(2),

                                nn.Conv2d(64, 128, 3, padding=1),nn.ReLU(inplace=True),
                                nn.Conv2d(128, 128, 3, padding=1),nn.ReLU(inplace=True),
                                nn.Conv2d(128, 128, 3, padding=1),nn.ReLU(inplace=True),
                                nn.MaxPool2d(2),

                                nn.Conv2d(128, 256, 3, padding=1),nn.ReLU(inplace=True),
                                nn.Conv2d(256, 256, 3, padding=1),nn.ReLU(inplace=True),
                                nn.Conv2d(256, 256, 3, padding=1),nn.ReLU(inplace=True),
                                nn.Conv2d(256, 256, 3, padding=1),nn.ReLU(inplace=True),
                                nn.MaxPool2d(2),

                                nn.Conv2d(256, 512, 3, padding=1),nn.ReLU(inplace=True),
                                nn.Conv2d(512, 512, 3, padding=1),nn.ReLU(inplace=True),
                                nn.Conv2d(512, 512, 3, padding=1), nn.ReLU(inplace=True),
                                nn.Conv2d(512, 512, 3, padding=1), nn.ReLU(inplace=True),
                                nn.MaxPool2d(2),

                                nn.Conv2d(512, 512, 3, padding=1), nn.ReLU(inplace=True),
                                nn.Conv2d(512, 512, 3, padding=1), nn.ReLU(inplace=True),
                                nn.Conv2d(512, 512, 3, padding=1), nn.ReLU(inplace=True),
                                nn.Conv2d(512, 512, 3, padding=1), nn.ReLU(inplace=True),
                                nn.MaxPool2d(2))
data = torch.ones(10, 3, 224, 224)
#print(feature_capture(data).shape)
#torch.Size([10, 512, 7, 7])

merge = nn.Sequential(nn.Dropout(0.5),
                      nn.Linear(7*7*512, 4096),nn.ReLU(inplace=True),
                      nn.Dropout(0.5),
                      nn.Linear(4096, 4096), nn.ReLU(inplace=True),
                      nn.Linear(4096, 1000), nn.Softmax(dim=1))

x = feature_capture(data).reshape(-1, 7*7*512)
merge(x)




class VGG16(nn.Module):
    def __init__(self):
        super(VGG16, self).__init__()
        self.features_ = feature_capture
        self.merge = merge

    def forward(self,x):
        x = self.features_(x)
        x = x.view(-1, 7*7*512)
        output = self.merge(x)
        return output

vgg = VGG16()
summary(vgg, input_size=(10, 3, 224, 224))

2.2 代替全连接层:1x1卷积核与全局平均池化(GAP)

虽然全连接层很有用，但它的参数量带来的计算成本的确是一个很大的问题。因此，研究者们曾经尝试找出各种方法，用来替代全连接层。其中流传比较广泛的方法之一，就是使用1x1卷积核来进行替代全连接层。虽然大部分持有此观点的材料的描述都模糊不清、甚至有胡言乱语之嫌，但是人们还是对1x1 卷积核替代全连接层的效果深信不疑。

从数学公式来看，全连接层和1x1的卷积层之间是可以互相转换的。对于卷积层来说，只要让特征图的尺寸为1x1，再让卷积核的尺寸也为1x1，就可以实现和普通全连接层一模一样的计算了。

在计算机视觉中，不包含全连接层，只有卷积层和池化层的卷积网络被叫做全卷积网络(fully- convolutional network，FCN)。在无数减少全连接层的努力中，1x1卷积核可以在架构上完全替代掉全连接层，来看下面的例子:

从之前1x1卷积核的例子来看，不难发现，只要在网络架构的最后能够将输出结果变成softmax函数可接受的格式，比如(n_class,1)，并且确定用于生成这些输入值的信息是从之前的特征图中整合出来的，那任意架构在理论上来说都足以替代全连接层。GAP层就是这样的一个例子。GAP层的本质是池化层，它使用池化方式是平均池化，它的职责就是将上一层传入的无论多少特征图都转化成(n_class,1, 1)结构。为了能够将无论什么尺寸的特征图化为1x1的尺寸，GAP层所使用的核尺寸就等于输入的特征图尺寸。

在PyTorch中，没有专门的GAP类，但我们可以使用普通的平均池化层，并令这个池化层的核尺寸为上层输入的特征图尺寸，以此来模拟全局平均池化。

data = torch.ones(10,7,7) 
gap = nn.AvgPool2d(7) 
print(gap(data).shape)

3 NiN网络的复现

import torch
import torch.nn as nn
from torchinfo import summary

data = torch.ones(10, 3, 32, 32)

class NiN(nn.Module):
    def __init__(self):
        super(NiN, self).__init__()
        self.block1 = nn.Sequential(nn.Conv2d(3, 192, 5, padding=2), nn.ReLU(inplace=True),
                                    nn.Conv2d(192, 160, 1), nn.ReLU(inplace=True),
                                    nn.Conv2d(160, 96, 1), nn.ReLU(inplace=True),
                                    nn.MaxPool2d(kernel_size=3, stride=2),
                                    nn.Dropout(0.25))

        self.block2 = nn.Sequential(nn.Conv2d(96, 192, 5, padding=2), nn.ReLU(inplace=True),
                                    nn.Conv2d(192, 192, 1), nn.ReLU(inplace=True),
                                    nn.Conv2d(192, 192, 1), nn.ReLU(inplace=True),
                                    nn.MaxPool2d(kernel_size=3, stride=2),
                                    nn.Dropout(0.5))

        self.block3 = nn.Sequential(nn.Conv2d(192, 192, 3, padding=1), nn.ReLU(inplace=True),
                                    nn.Conv2d(192, 192, 1), nn.ReLU(inplace=True),
                                    nn.Conv2d(192, 10, 1), nn.ReLU(inplace=True),
                                    nn.AvgPool2d(kernel_size=7),
                                    nn.Softmax(dim=1))


    def forward(self, x):
        output = self.block3(self.block2(self.block1(x)))
        return output

net = NiN()
print(net(data).shape)
#torch.Size([10, 10, 1, 1])

summary(net,(10, 3, 32, 32))

作为9层卷积层、最大特征图数目达到192的网络，NiN的参数量在百万之下，可以说都是归功于没有使用全连接层。不过，1x1卷积层所带来的参数量也不少，因此NiN可以说是在各方面都中规中矩的网络。从今天的眼光来看，NiN网络最大的贡献就是在于让人们意识到了1x1卷积层可能的用途，并且将“舍弃线性层”的议题摆在了研究者面前。受到NiN网络启发而诞生的GoogLeNet以及ResNet都使用了1x1卷积层，并且在各种消减参数的操作下使网络变得更加深。

你可能感兴趣的:(pytorch,网络,深度学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
2023-04-17|篮球女孩长一木
1小学抑或初中阶段，在课外书了解到她的故事。“篮球女孩”。当时佩服她的顽强，也对生命多了一丝敬畏。今天刚好在公众号看到，长大后的“篮球女孩”。佩服之余又满是心疼。网络侵删祝那素未蒙面的女孩，未来一切顺遂。
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
《在战“疫”中成长致敬生活》观后感梅子刘的刀
（作者：周晨）今天上午，我看了“我是接班人”网络大课堂《在战役中成长致敬生活》。有很多人拿出自己攒下的钱，默默地捐给了武汉，有几千块钱的、有几万块钱的，也有十几万块钱的。连小朋友也把自己的压岁钱捐给了武汉。有名环卫工人把自己五年的积蓄全部捐给了武汉。有名外卖小哥为医护人员买鞋子送吃的。还有已经治愈出院的新型肺炎病人捐了400毫升的血浆。还有位叫大树的叔叔，虽然他没有钱，但是他地里有蔬菜，捐了几大卡
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
多子女家庭问题 3e5c5362403c
杨宁宁焦点解决网络初17中19坚持分享589天（2021.3.20）本周约练我1次，总计166次，读书打卡第256天案例督导收获：【家有老大篇】被爱与高期待下的独舞家里的第一个孩子往往集万千宠爱于一身。爸爸妈妈、爷爷奶奶、姥姥姥爷的目光都聚焦在他的身上。在这种光环下长大的孩子，就如小皇帝一般，衣来伸手、饭来张口。拥有爱的同时，也意味着拥有了更高的被期待，父母会花血本给你报各种各样的早教班，给你买各
父母教育孩子的方式，将影响孩子一生树英教育
为什么有些孩子总是充满自信与快乐？独立、有主见又坚强？而有些孩子却自卑、胆怯，软弱又过度依赖父母？为什么有些孩子总是健康、阳光又富于创造力？而有些孩子却悲观、孤僻又思想空乏？一个孩子的行为取决于孩子的思想，思想取决于环境和自己的认知，认知取决于教育。父母是孩子人生中的第一位教育者，父母养育孩子的方式，将决定他们人生的高度，影响他们的一生。网络图，侵权即删优秀的父母就像园丁，既要浇水施肥，又要修剪杂
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
网络通信流程记得开心一点啊服务器网络运维
目录♫IP地址♫子网掩码♫MAC地址♫相关设备♫ARP寻址♫网络通信流程♫IP地址我们已经知道IP地址由网络号+主机号组成，根据IP地址的不同可以有5钟划分网络号和主机号的方案：其中，各类地址的表示范围是：分类范围适用网络网络数量主机最大连接数A类0.0.0.0~127.255.255.255大型网络12616777214【(2^24)-2】B类128.0.0.0~191.255.255.255中
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
计算机木马详细编写思路小熊同学哦 php 开发语言木马木马思路
导语：计算机木马（ComputerTrojan）是一种恶意软件，通过欺骗用户从而获取系统控制权限，给黑客打开系统后门的一种手段。虽然木马的存在给用户和系统带来严重的安全风险，但是了解它的工作原理与编写思路，对于我们提高防范意识、构建更健壮的网络安全体系具有重要意义。本篇博客将深入剖析计算机木马的详细编写思路，以及如何复杂化挑战，以期提高读者对计算机木马的认识和对抗能力。计算机木马的基本原理计算机木
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
高考后该不该给孩子买电脑，什么情况能买？什么情况不能买？寻求改变
我知道家长们很担心，怕买了电脑小孩沉迷游戏，耽误了学业，也不利于身体健康。对于准大学生来说，基本上在18岁左右，也不算小了，但在很多父母眼里，依旧是个小孩子。数据显示，这种情况是有发生的，大学生约70%的电脑主要被用于玩网络游戏，如果没有养成一个用良好的习惯，对孩子影响是非常大的。我总结为三买，三不买。最近有看到群里很多家长再问，小孩上大学该不该给他买电脑，要买和不买两种观点的家长都有，那么哪种情
ESP32-C3入门教程网络篇⑩——基于esp_https_ota和MQTT实现开机主动升级和被动触发升级的OTA功能小康师兄 ESP32-C3入门教程 https 服务器 esp32 OTA MQTT
文章目录一、前言二、软件流程三、部分源码四、运行演示一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读ESP32-C3入门教程网络篇⑨——基于esp_https_ota实现史上最简单的ESP32OTA远程固件升级功能二、软件流程
中国广电永久9元流量套餐！性价比最高流量卡套餐介绍！优惠攻略官
中国广电是中国最大的传媒集团之一，其推出的流量套餐备受消费者青睐。中国广电最实惠的流量套餐不仅价格亲民，而且提供了优质的网络体验。首先，中国广电的流量套餐价格实惠，适合不同消费者的需求。无论是短期的日租卡还是长期有效的月租卡，用户都可以根据自己的实际情况选择适合自己的套餐。而且，流量的价格相对于其他运营商的套餐来说更加合理，给用户提供了更大的选择空间。☞大流量卡套餐「→点这免费申请办理」或者截图扫
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
4 大低成本娱乐方式: 小说, 音乐, 视频, 电子游戏穷人小水滴娱乐音视频低成本小说游戏
穷人如何获得快乐?小说,音乐,视频,游戏,本文简单盘点一下这4大低成本(安全)娱乐方式.这里是穷人小水滴,专注于穷人友好型低成本技术.(本文为58号作品.)目录1娱乐方式1.1小说(网络小说)1.2音乐1.3视频(b站)1.4游戏(电子游戏/计算机软件)2低成本:一只手机即可3总结与展望1娱乐方式这几种,也可以说是艺术的具体形式.更专业的说,(娱乐)是劳动力再生产的重要组成部分.使人放松,获得快乐
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
计算机网络八股总结 Petrichorzncu 八股总结计算机网络笔记
这里写目录标题网络模型划分（五层和七层）及每一层的功能五层网络模型七层网络模型（OSI模型）==三次握手和四次挥手具体过程及原因==三次握手四次挥手TCP/IP协议组成==UDP协议与TCP/IP协议的区别==Http协议相关知识网络地址，子网掩码等相关计算网络模型划分（五层和七层）及每一层的功能五层网络模型应用层：负责处理网络应用程序，如电子邮件、文件传输和网页浏览。主要协议包括HTTP、FTP
每日头像|爱与时光，终年不遇一宝先生
小可爱们晚上好呀今天晚上来推送一期情侣头像~喜欢的小可爱可以点赞收藏评论哟~部分素材来自网络，版权归原创者，如有侵权请联系删除今天的头像结束啦喜欢的小可爱可以点下关注哟~如果喜欢本期的内容可以转发分享哦~那我们下期再见咯~拜了个拜~
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
进销存小程序源码 PHP网络版ERP进销存管理系统全开源可二开摸鱼小号 php
可直接源码搭建部署发布后使用：一、功能模块介绍该系统模板主要有进，销，存三个主要模板功能组成，下面将介绍各模块所对应的功能；进：需要将产品采购入库，自动生成采购明细台账同时关联财务生成付款账单；销：是指对客户的销售订单记录，汇总生成产品销售明细及回款计划；存：库存的日常盘点与统计，库存下限预警、出入库台账、库存位置等。1.进购管理采购订单：采购下单审批→由上级审批通过采购入库；采购入库：货品到货>
年的味道~ 心理疗愈师英子
小时候，最期盼过年，一想到过年有压岁钱拿、有新衣服穿、不用上学还有好东西吃，就兴奋不已。可是不知道从什么时候开始，很多人那种儿时满怀期待过年的感觉没有了，对年的期盼也越来越少。现在物质极大丰富，以前过年才有的丰盛年夜饭，现在几乎已成家常便饭，对过年有好东西吃的期盼没了。现在网络购物发达，服装店也遍布大街小巷，随时都可以添置新衣服，而不必非要等到过年，儿时那种大年初一从头新到脚的仪式感没有了。放鞭炮
2021-07-09 2018心如止水
张雲芳焦点解决网络课程学习坚持分享第816天20210709本周第2次（约练总291）渴了喝水；饿了吃饭；累了休息。看似简单的选择与行为，做起来却没那么容易。尤其是作为成年人，每天有工作需要完成，有孩子、家人需要陪伴，有时候各种事情赶在一起，忙的晕头转向、焦头烂额，即使自己特别累，也没有间隙去休息一下下，想象一下身体疲惫，精力耗竭是什么样的状态？对于孩子的哭闹你还会有更多的耐心吗？我想多数情况下都
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag