midori_27

近年热门分类CNN网络结构的总结

总结的网络结构有：LeNet、AlexNet、ZF-Net、VGG、谷歌系列 :Inception v1到v4、Resnet、ResnetXt、SeNet、DenseNet、DPN。

LeNet

创新点：定义了CNN的基本组件，是CNN的鼻祖。

LeNet是卷积神经网络的祖师爷LeCun在1998年提出，用于解决手写数字识别的视觉任务。自那时起，CNN的最基本的架构就定下来了：卷积层、池化层、全连接层。

网络结构：

LaNet-5的局限性
CNN能够得出原始图像的有效表征，这使得CNN能够直接从原始像素中，经过极少的预处理，识别视觉上面的规律。然而，由于当时缺乏大规模训练数据，计算机的计算能力也跟不上，LeNet-5 对于复杂问题的处理结果并不理想。

AlexNet

2012年，Imagenet比赛冠军的model，作者是Alex，Hinton的学生

论文链接

参考：
在AlexNet中LRN 局部响应归一化的理解
tf.nn.conv3d和tf.nn.max_pool3d这两个tensorflow函数的功能和参数
Tensorflow的LRN是怎么做的
1D,2D,3D卷积的区别
3d卷积是如何计算的

创新点：

（1）成功使用ReLU作为CNN的激活函数，并验证其效果在较深的网络超过了Sigmoid，成功解决了Sigmoid在网络较深时的梯度弥散问题。虽然ReLU激活函数在很久之前就被提出了，但是直到AlexNet的出现才将其发扬光大。

（2）训练时使用Dropout随机忽略一部分神经元，以避免模型过拟合。Dropout虽有单独的论文论述，但是AlexNet将其实用化，通过实践证实了它的效果。在AlexNet中主要是最后几个全连接层使用了Dropout。

（3）在CNN中使用重叠的最大池化(相邻池化窗口之间会有重叠区域，此时kernel size>stride)。此前CNN中普遍使用平均池化，AlexNet全部使用最大池化，避免平均池化的模糊化效果。并且AlexNet中提出让步长比池化核的尺寸小，这样池化层的输出之间会有重叠和覆盖，提升了特征的丰富性。

网络结构：

AlexNet将LeNet的思想发扬光大，把CNN的基本原理应用到了很深很宽的网络中。说实话，这个model的意义比后面那些model都大很多，首先它证明了CNN在复杂模型下的有效性，然后GPU实现使得训练在可接受的时间范围内得到结果，确实让CNN和GPU都大火了一把，顺便推动了有监督DL的发展。

关于为什么使用max pooling的理解：

池化的两种常见误差归纳如下：
（1）邻域大小受限造成的估计值方差增大；（2）卷积层参数误差造成估计均值的偏移。
一般来说，mean-pooling能减小第一种误差，更多的保留图像的背景信息；max-pooling能减小第二种误差，更多的保留纹理信息。
边缘检测，就是因为边缘信息跟背景信息差别大，所以才能检测。max-pooling就是保留了最明显的信息。mean-pooling因为平均考虑，所以背景信息也保留了，所以肯定会丢失信息。

使用实验证明：

重叠池化：其他的设置都不变的情况下， top-1和top-5 的错误率分别减少了0.4% 和0.3%。

（4）提出了LRN层，对局部神经元的活动创建竞争机制，使得其中响应比较大的值变得相对更大，并抑制其他反馈较小的神经元，增强了模型的泛化能力。

LRN全称是local response normalization，局部响应归一化。

LRN的动机是 对于图像中的每个位置来说，我们可能并不需要太多的高激活神经元。但是后来，很多研究者发现 LRN 起不到太大作用，因为并不重要，而且我们现在并不用 LRN 来训练网络。

与BN的区别：
BN归一化主要发生在不同的样本之间，LRN归一化主要发生在不同的卷积核的输出之间。

公式：

其次，官方API的介绍是这样的：

	sqr_sum[a, b, c, d] = sum(input[a,b, c, d - depth_radius : d + depth_radius + 1] ** 2)
	output = input / (bias +alpha * sqr_sum) ** beta

以alexnet的论文为例，输入暂且定为 [batch_size, 224, 224, 96]，这里224×224是图片的大小，经过第一次卷积再经过ReLU，就是LRN函数的输入。

注意上面API说明里的sum函数，意思就是，可能解释起来比较拗口，针对batch里每一个图的后3维向量，[224, 224, d - depth_radius : d + depth_radius + 1]，对它按照半径 depth_radius求每个图里的每个像素的平方，再把这2× depth_radius+1个平方过后的图片加起来，就得到了这个batch的sqr_sum。

LRN的Pytorch代码：

	class LRN(nn.Module):
    '''
    这个网络貌似后续被其它正则化手段代替，如dropout、batch normalization等。
    目前该网络基本上很少使用了，这里为了原生的AlexNet而实现
    '''
	    def __init__(self, local_size=1, alpha=1.0, beta=0.75, ACROSS_CHANNELS=False):
	        super(LRN, self).__init__()
	        self.ACROSS_CHANNELS = ACROSS_CHANNELS
	        if self.ACROSS_CHANNELS:
	            self.average=nn.AvgPool3d(kernel_size=(local_size, 1, 1), #0.2.0_4会报错，需要在最新的分支上AvgPool3d才有padding参数
	                    stride=1,
	                    padding=(int((local_size-1.0)/2), 0, 0)) 
	        else:
	            self.average=nn.AvgPool2d(kernel_size=local_size,
	                    stride=1,
	                    padding=int((local_size-1.0)/2))
	        self.alpha = alpha
	        self.beta = beta	    
	        
	    def forward(self, x):
	        if self.ACROSS_CHANNELS:
	            div = x.pow(2).unsqueeze(1)
	            div = self.average(div).squeeze(1)
	            div = div.mul(self.alpha).add(1.0).pow(self.beta)#这里的1.0即为bias
	        else:
	            div = x.pow(2)
	            div = self.average(div)
	            div = div.mul(self.alpha).add(1.0).pow(self.beta)
	        x = x.div(div)
	        return x

我对公式的理解：x、y指的是固定的同一层同一位置width和height的值，i指的是第i层，公式只对第四维channal操作，depth_radius是可选的特征图范围，也就是对同一层同一位置不同的特征图的信息做累加操作。
代码中ACROSS_CHANNELS是否跨通道，使用3d的池化，也就是在第二维多了一个depth维度，3d一般用来处理视频，考虑时间维度的信息，多出来的维度是帧数。

ZF-Net

2013 ImageNet分类任务的冠军，其网络结构较AlexNet没什么改进，只是调了调参，性能较AlexNet提升了不少。
ZF-Net只是将AlexNet第一层卷积核由11变成7，步长由4变为2，第3，4，5卷积层转变为384，384，256。

创新点：

使用了更小的卷积核

VGG

论文链接
参考博客：VGG模型核心拆解、VGGNet网络结构

牛津大学计算机视觉组和DeepMind公司共同研发一种深度卷积网络，在ImageNet 2014年比赛上获得了分类项目的第二名，GoogleNet是第一名。

创新点:

全部使用更小的3*3卷积核，探索以堆叠小尺寸卷积核的方式来替代大尺寸卷积核，加深网络。
预训练(pre-trained)技巧。训练时，先训练级别简单（层数较浅）的VGGNet的A级网络，然后使用A网络的权重来初始化后面的复杂模型，加快训练的收敛速度。
采用了Multi-Scale的方法来针对训练和预测做数据增强。

VGGNet使用了Multi-Scale的方法做数据增强，将原始图像缩放到不同尺寸S，然后再随机裁切，这样能增加很多数据量，对于防止模型过拟合有很不错的效果。实践中，作者令S在[256,512]这个区间内取值，使用Multi-Scale获得多个版本的数据，并将多个版本的数据合在一起进行训练。

实验证明了LRN层无性能增益（A和A-LRN）。LRN是一种跨通道去normalize像素值的方法。

为什么使用3 * 3卷积来代替7 * 7或5 * 5卷积？

非线性操作更多，学习特征的能力更强。因为如果使用的都是线性操作，相当于整个网络都在做同样的事情，至是单纯地把参数加倍，加多少层都是一样的效果。非线性函数可以更好的拟合复杂的函数。
参数量更少。

感受野的计算:

	假设输入i*i
	3*3卷积：
	    第一次     (i-3)/1+1 = i-2
	    第二次     (i-2-3)/1+1 = i-4
	    第三次     (i-4-3)/1+1 = i-6
	5*5卷积:    (i-5)/1+1 = i-4
	7*7卷积:    (i-7)/1+1 = i-6

可以看出：两个 3 * 3 卷积层的串联相当于1个 5 * 5 的卷积层，3个 3 * 3 的卷积层串联相当于1个 7 * 7 的卷积层，即3个 3 * 3 卷积层的感受野大小相当于1个 7 * 7 的卷积层。

参数的计算：

		对于3个3*3卷积，(C * C * 3 * 3) *3= 27C^2 
		对于1个7*7卷积，(C * C * 7 * 7) = 49C^2
		∴ 3个3*3卷积的参数量小于1个7*7卷积

        对于2个3*3卷积，(C * C * 3 * 3) *2= 18C^2 
        对于1个5*5卷积，(C * C * 5 * 5) = 25C^2
		∴ 2个3*3卷积的参数量小于1个5*5卷积

网络结构

谷歌系列 :Inception v1到v4

Paper列表：

[v1] Going Deeper with Convolutions, 6.67% test error, 2014
[v2] Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift, 4.8% test error, 2015
[v3] Rethinking the Inception Architecture for Computer Vision, 3.5% test error,2015
[v4] Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning, 3.08% test error,2016

大体思路：引用自博客

Inception v1的网络，将1x1，3x3，5x5的conv和3x3的pooling，stack在一起，一方面增加了网络的width，另一方面增加了网络对尺度的适应性；
v2的网络在v1的基础上，进行了改进，一方面了加入了BN层，减少了Internal - Covariate Shift（内部neuron的数据分布发生变化），使每一层的输出都规范化到一个N(0, 1)的高斯，另外一方面学习VGG用2个3x3的conv替代inception模块中的5x5，既降低了参数数量，也加速计算；
v3一个最重要的改进是分解（Factorization），将7x7分解成两个一维的卷积（1x7,7x1），3x3也是一样（1x3,3x1），这样的好处，既可以加速计算（多余的计算能力可以用来加深网络），又可以将1个conv拆成2个conv，使得网络深度进一步增加，增加了网络的非线性，还有值得注意的地方是网络输入从224x224变为了299x299，更加精细设计了35x35/17x17/8x8的模块；
v4研究了Inception模块结合Residual Connection能不能有改进，发现ResNet的结构可以极大地加速训练，同时性能也有提升，主要目的是提升速度；同时将卷积层堆叠顺序（1x1,3x3）变成（3x3, 1x1）。

GoogLeNet（即Inception V1）

之所以是GoogLeNet而非GoogleNet,文章说是为了向早期的LeNet致敬。

论文链接
GoogLeNet系列解读
GoogleNet系列论文学习

在ImageNet2014和VGG竞争的第一名，这两个网络的大体思路都是一致的：go deeper。不同的是GoogleNet提出了Inception结构，往宽度探索，ImageNet主要还是在AlexNet结构上探索。

创新点：

引入Inception结构
中间层的辅助LOSS单元
后面的全连接层全部替换为简单的全局平均池化(GAP)

网络结构

Inception结构

对上图做以下说明：

1 . 采用不同大小的卷积核意味着不同大小的感受野，最后拼接意味着不同尺度特征的融合；
2 . 之所以卷积核大小采用1、3和5，主要是为了方便对齐。设定卷积步长stride=1之后，只要分别设定pad=0、1、2，那么卷积之后便可以得到相同维度的特征，然后这些特征就可以直接拼接在一起了；
3 . 文章说很多地方都表明pooling挺有效，所以Inception里面也嵌入了；
4 . 网络越到后面，特征越抽象，而且每个特征所涉及的感受野也更大了，因此随着层数的增加，3x3和5x5卷积的比例也要增加。

改进版本：使用1 * 1卷积降维

全连接层一般是用来做分类，后接softmax等激活函数来输出分类的概率。
全局平均池化(GAP)来替代全连接层，原因是：对每个通道的feature map降维，尺寸降为1 * 1，既能实现全连接层的功能，又能避免全连接层的参数量过大、过拟合的问题。
Global Average Pooling全局平均池化的一点理解、关于 global average pooling

BN-GoogLeNet（即BN-Inception、Inception V2）

参考博客:
1.《Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shift》阅读笔记与实现
2.从白化到BN、计算过程、求导过程
改进：

使用BN层，这样做的好处是：
① 允许使用更高的学习速率并且不太关心初始化，加快训练速度。如果每层的scale不一致，实际上每层需要的学习率是不一样的，同一层不同维度的scale往往也需要不同大小的学习率，通常需要使用最小的那个学习率才能保证损失函数有效下降，Batch Normalization将每层、每维的scale保持一致，那么我们就可以直接使用较高的学习率进行优化。
② 训练深度神经网络的复杂性在于，每层输入的分布在训练过程中会发生变化，因为前面的层的参数会发生变化。BN使每一层的输出都规范化到一个N(0, 1)的高斯，减轻了Internal Covariate Shift。
使用两个3 * 3卷积模块代替一个5 * 5（学习VGG），降低参数数量，加速计算。
移除或使用较低的dropout。 dropout是常用的防止overfitting的方法，而导致overfit的位置往往在数据边界处，如果初始化权重就已经落在数据内部，overfit现象就可以得到一定的缓解。论文中最后的模型分别使用10%、5%和0%的dropout训练模型，与之前的40%-50%相比，可以大大提高训练速度。
降低L2权重衰减系数。还是一样的问题，边界处的局部最优往往有几维的权重（斜率）较大，使用L2衰减可以缓解这一问题，现在用了Batch Normalization，就可以把这个值降低了，论文中降低为原来的5倍。
取消Local Response Normalization层。由于使用了一种Normalization，再使用LRN就显得没那么必要了。而且LRN实际上也没那么work。

Inception V3

参考博客
改进：

重大改进：使用分解卷积(Factorizing into smaller convolution) ，例如1 * 7、7 * 1 代替 7 * 7Conv，多余的计算能力可以多设1 * 1卷积来加深网络，增强非线性。
优化方式选择RMSProp，需要求参数的二阶导。
label smoothing

new_labels = (1.0 - label_smoothing) * one_hot_labels + label_smoothing / num_classes

在网络实现的时候，令 label_smoothing = 0.1，num_classes = 1000。Label smooth提高了网络精度0.2%。

我对label smoothing理解是这样的，它把原来很突兀的one_hot_labels稍微的平滑了一点，枪打了出头鸟，削了立于鸡群那只鹤的脑袋，分了点身高给鸡们，避免了网络过度学习labels而产生的弊端。

bn-auxiliary classifier
引入了附加分类器，其目的是从而加快收敛。辅助分类器其实起着着regularizer的作用。当辅助分类器使用了batch-normalized或dropout时，主分类器效果会更好。

    1. 输入:3 * 299 * 299
	
	############################## 输入处理 ###############################
	# (Basic Conv Model:Conv2d->bn->relu)                                                
	######################################################################
    2. Basic_Conv_Model： 32 * 149 *149 （k=3，s=2）
    3. Basic_Conv Model： 32 * 147 *147 （k=3）
    4. Basic_Conv_Model： 64 * 147 *147 （k=3，p=1）
    5. max_pool ：64 * 73 * 73 （k=3，s=2）
    6. Basic_Conv_Model： 80 *  73 * 73 （k=1）
    7. Basic_Conv_Model： 192 * 71 * 71 （k=3）
    8. max_pool ：192 * 35 * 35 （k=3，s=2）
	
	############################## InceptionA ###############################
	# branch1: 1 * 1 Conv  
	# branch2: 1 * 1 Conv -> 5 * 5 Conv (p=2)
	# branch3: 1 * 1 Conv -> 3 * 3 Conv (p=1)   -> 3 * 3 Conv (p=1)  
	# branch4: avg_pool(k=3,p=1) -> 1 * 1 Conv                                         
	######################################################################
    9. 256 * 35 * 35 
    10.  288 * 35 * 35 
    11.  288 * 35 * 35 

    ############################## InceptionB ##############################
	# branch1: 3 * 3 Conv  （s=2）
	# branch2: 1 * 1 Conv -> 3 * 3 Conv (p=1)   -> 3 * 3 Conv (s=2)  
	# branch3: max_pool(k=3,s=2)                                    
	######################################################################
    12. 768 * 17 * 17
    
    ############################## InceptionC ##############################
	# branch1: 1 * 1 Conv  
	# branch2: 1 * 1 Conv -> 1 * 7 Conv (p=(0,3))  -> 7 * 1 Conv (p=(3,0))  
	# branch3: 1 * 1 Conv -> 7 * 1 Conv (p=(3,0))  -> 1 * 7 Conv (p=(0,3)) 
	#          -> 7 * 1 Conv (p=(3,0)) -> 1 * 7 Conv (p=(0,3))       
	# branch4: avg_pool(k=3,p=1) -> 1 * 1 Conv                          
	######################################################################
    13.  768 * 17 * 17
    14.  768 * 17 * 17
    15.  768 * 17 * 17
    16.  768 * 17 * 17
 
    ############################## InceptionD ##############################
	# branch1: 1 * 1 Conv -> 3 * 3 Conv（s=2）
	# branch2: 1 * 1 Conv -> 1 * 7 Conv (p=(0,3))->7 * 1 Conv(p=(3,0))  
	#          -> 3 * 3 Conv(s=2)
	# branch3: 1 * 1 Conv -> 7 * 1 Conv (p=(3,0))  -> 1 * 7 Conv (p=(0,3)) 
	#               -> 7 * 1 Conv (p=(3,0)) -> 1 * 7 Conv (p=(0,3))       
	# branch4: max_pool(k=3,s=2)                  
	######################################################################
    17. 1280 * 8 * 8
  
    ############################## InceptionE ##############################
	# branch1: 1 * 1 Conv  
	# 1 * 1 Conv的参数共享  
	# branch2_1: 1 * 1 Conv -> 1 * 3 Conv (p=(0,3)) 
	# branch2_2: 1 * 1 Conv -> 3 * 1 Conv (p=(3,0))  
	# 1 * 1 、3 * 3 Conv的参数共享    
	# branch3_1: 1 * 1 Conv -> 3 * 3 Conv (p=1) -> 1 * 3 Conv (p=(0,3)) 
	# branch3_2: 1 * 1 Conv -> 3 * 3 Conv (p=1) -> 3 * 1 Conv (p=(3,0))  ,     
	# branch4: avg_pool(k=3,p=1) -> 1 * 1 Conv                          
	######################################################################
    18. 2048 * 8 * 8
    19. 2048 * 8 * 8
  
    # 输出处理
    20. avg pool ：2048 * 1 * 1 （k=8）
    21. dropout ： 2048 * 1 * 1 
    22. flatten ：2048 
    23. fc：  num_class

Inception V4

网络结构图
16年提出，受到15年resnet的启发。
inception v4实际上是把原来的inception v3加上了resnet的方法，从一个节点能够跳过一些节点直接连入之后的一些节点，并且残差也跟着过去一个。
另外就是V4把一个先1 * 1再3 * 3那步换成了先3 * 3再1 * 1.
论文说引入resnet不是用来提高深度，进而提高准确度的，只是用来提高速度的。

Resnet

论文链接
作者何凯明，ImageNet 2015比赛classification任务上获得第一名。

问题引出：

退化问题。随着网络的加深，出现了训练集准确率下降的现象，我们可以确定这不是由于Overfit造成的(过拟合的情况训练集应该准确率很高)；所以作者针对这个问题提出了一种全新的网络，叫深度残差网络，它允许网络尽可能的加深，其中引入了全新的结构。

残差指的是什么？

其中ResNet提出了两种mapping：一种是identity mapping，指的就是图1中”弯弯的曲线”，另一种residual mapping（18、34使用basicblock，50、101、152使用bottleneck），指的就是除了”弯弯的曲线“那部分，所以最后的输出是y=F(x)+shortcut(x)，最大的优势就是既能避免梯度消失、梯度爆炸又不增加额外的复杂度。identity mapping顾名思义，就是指本身，也就是公式中的x，而residual mapping指的是“差”，也就是y−x，所以残差指的就是F(x)部分。shortcut是在F(x)和x维度不匹配时使用，使用1 * 1卷积来统一维度。

于是通过VGG19设计出了plain 网络和残差网络，如下图中部和右侧网络。然后利用这两种网络进行实验对比。

论文中讨论了多张shortcut的形式，最后发现a的效果好。

ResnetXt

论文：Aggregated Residual Transformations for Deep Neural Networks Saining
参考博客：ResnetXt算法详解
Resnet的变体，ImageNet 2016的第二名，出自论文“Aggregated Residual Transformations for Deep Neural Networks”，主要是将残差块的中间的 3x3卷积层变成group卷积，同时扩大了3x3卷积的输入输出通道数，使得在与对应的ResNet网络的计算量和参数个数相近的同时提高网络的性能。值得一提的是，ResNeXt与常用的ResNet对应的层数完全相同，都是50、101、152层。ResNeXt已经被很多网络用来当作backbone，例如Mask RCNN中除了使用ResNet，也尝试使用了ResNeXt-101和ResNeXt-152。

解释cardinality:
原文的解释是the size of the set of transformations，如下图（左Resnet，右ResnetXt）右边是 cardinality=32 ，这里注意每个被聚合的拓扑结构都是一样的(这也是和 Inception 的差别，减轻设计负担)

参数量对比：

   #Resnet
   256*1*1*64+64*3*3*64+64*1*1*256 = 69632
   #ResnetXt
   (256*1*1*4+4*3*3*4+4*1*1*256)*32 = 70144

可见参数量差不多，网络宽度却增加了不少。

作者提出 ResNeXt 的主要原因在于：传统的要提高模型的准确率，都是加深或加宽网络，但是随着超参数数量的增加（比如channels数，filter size等等），网络设计的难度和计算开销也会增加。因此本文提出的 ResNeXt 结构可以在不增加参数复杂度的前提下提高准确率，同时还减少了超参数的数量。

附上原文比较核心的一句话，点明了增加 cardinality 比增加深度和宽度更有效：

当然还有一些数据证明 ResNeXt 网络的优越性，例如原文中的这句话：In particular, a 101-layer ResNeXt is able to achieve better accuracy than ResNet-200 but has only 50% complexity.

下图列举了 ResNet-50 和 ResNeXt-50 的内部结构，最后两行说明二者之间的参数量差别不大。

SeNet

论文：Squeeze-and-Excitation Networks
参考博客: SeNet算法笔记

ImageNet 2017第一名, Momenta (自动驾驶公司) 胡杰。

问题引出：
卷积神经网络建立在卷积运算的基础上，通过融合局部感受野内的空间信息和通道信息来提取信息特征。为了提高网络的代表性能力，许多现有工作已经显示出 增强空间编码 的好处。我们的目标是确保能够 提高网络对信息特征的敏感度 ，以便后续转换可以利用这些功能，并抑制不太有用的功能。我们建议通过显式建模 通道依赖性 来实现这一点，以便在进入下一个转换之前通过两步重新校准滤波器响应。

贡献：

引入“挤压和激励模块”（Squeeze-and-Excitation）：通过显示的对卷积层特征之间的通道相关性进行建模来提升模型的表征能力；
提出了特征重校准机制：通过使用全局信息去选择性的增强可信息化的特征并同时压缩那些无用的特征。

    def forward(self, x):
        out = F.relu(self.bn1(x))
        #维度对齐
        shortcut = self.shortcut(out) if hasattr(self, 'shortcut') else x
        out = self.conv1(out)
        out = self.conv2(F.relu(self.bn2(out)))

        # Squeeze
        w = F.avg_pool2d(out, out.size(2))
        w = F.relu(self.fc1(w))
        w = F.sigmoid(self.fc2(w))
        # Excitation
        out = out * w

        out += shortcut
        return out

解释Squeeze操作：
网络较低的层次其感受野尺寸很小（一般做1 * 1Conv来解决维度不匹配），Squeeze操作顺着空间维度来进行特征压缩（平均池化，将feature map的尺寸压缩为1 * 1），将每个二维的特征通道变成一个实数，这个实数某种程度上具有全局的感受野，并且输出的维度和输入的特征通道数相匹配。它表征着在特征通道上响应的全局分布，而且使得靠近输入的层也可以获得全局的感受野。
解释Excitation操作：
它是一个类似于循环神经网络中门的机制。通过参数 w 来为每个特征通道生成权重，其中参数 w 被学习用来显式地建模特征通道间的相关性。
解释Reweight（特征重校准）
最后是一个 Reweight 的操作，我们将 Excitation 的输出的权重看做是进过特征选择后的每个特征通道的重要性，然后通过乘法逐通道加权到先前的特征上，完成在通道维度上的对原始特征的重标定。

在实际网络中怎么添加SE模块？
Figure2是在Inception中加入SE block的情况。
Figure3是在ResNet中添加SE block的情况。

这两个全连接层的作用就是融合各通道的feature map信息，因为前面的squeeze都是在某个channel的feature map里面操作。

DenseNet

这篇文章是 CVPR 2017的oral论文

参考AI之路的博客
论文：Densely Connected Convolutional Networks
原作者的一些解释

最近的研究表明，想要训练一个更深更准确的网络，让靠近输入的层和靠近输出的层之间有更短的连接是有效的。

优点：

缓解梯度消失。这个思想是基于ResNet的，DenseNet中的每一层可以直接接触到原始输入并且能接触到损失拿到梯度。
正则化效果。论文中提出Composite function，包含BN->Relu->Conv。
特征重用。减少特征图的数量，使网络更narrow，参数更少，因此能够更深，效果比ResNet好。
抗过拟合性。在CIFAR的数据集上做过实验，卷积每一层特征的提取都相当于对输入做非线性变换，而DenseNet汇聚了浅层特征的特点，有更好的泛化性。

传统的神经网络L层就会有L个连接，但是在DenseNet中，会有L(L+1)/2个连接，改动最大的地方是在block结构中，ResNet将输入block 的部分和输出结果做累加，而DenseNet直接将两者concat起来，所以叫做密集连接。

以下两个公式能说明两者的不同：
ResNet， Densenet

以下是一个layer的示例图：

网络结构设置

其中growth rate(即k)是卷积核个数变换的基数。

文章同时提出了DenseNet`，DenseNet-B，DenseNet-BC，三种结构，具体区别如下：

原始DenseNet:

Dense Block模块:BN+Relu+Conv(3*3)+dropout

transition layer模块:BN+Relu+Conv(11)(filternum:m)+dropout+Pooling(22)

DenseNet-B:

Dense Block模块:BN+Relu+Conv(11)(filternum:4K)+dropout+BN+Relu+Conv(33)+dropout

transition layer模块:BN+Relu+Conv(11)(filternum:m)+dropout+Pooling(22)

DenseNet-BC:

Dense Block模块:BN+Relu+Conv(11)(filternum:4K)+dropout+BN+Relu+Conv(33)+dropout

transition layer模块:BN+Relu+Conv(11)(filternum:θm，其中0<θ<1，文章取θ=0.5)+dropout+Pooling(22)

其中，DenseNet-B在原始DenseNet的基础上，在Dense Block模块中加入了1*1卷积，使得将每一个layer输入的feature map都降为到4k的维度，大大的减少了计算量。

DenseNet-BC在DenseNet-B的基础上，在transitionlayer模块中加入了压缩率θ参数，论文中将θ设置为0.5，这样通过1*1卷积，将上一个Dense Block模块的输出feature map维度减少一半。

反正无脑用DenseNet-BC就行了

训练细节：
使用随机梯度下降（SGD）训练所有网络。

在CIFAR和SVHN上，我们使用批量训练大小为64，分别训练300和40个时期。最初的学习率设定为0.1，并且在训练时期总数的50％和75％时除以10。
在ImageNet上，我们训练90个时期的模型，批量大小为256。学习率最初设定为0.1，并在epoch 30和60时除以10。

DPN

论文:Dual Path Networks,CVPR 2017
参考博客：DPN（Dual Path Network）算法详解

优点：
1、关于模型复杂度，作者的原文是这么说的：The DPN-92 costs about 15% fewer parameters than ResNeXt-101 (32 4d), while the DPN-98 costs about 26% fewer parameters than ResNeXt-101 (64 4d).
2、关于计算复杂度，作者的原文是这么说的：DPN-92 consumes about 19% less FLOPs than ResNeXt-101(32 4d), and the DPN-98 consumes about 25% less FLOPs than ResNeXt-101(64 4d).

class Bottleneck(nn.Module):
    def __init__(self, last_planes, in_planes, out_planes, dense_depth, stride, first_layer):
        super(Bottleneck, self).__init__()
        self.out_planes = out_planes
        self.dense_depth = dense_depth

        self.conv1 = nn.Conv2d(last_planes, in_planes, kernel_size=1, bias=False)
        self.bn1 = nn.BatchNorm2d(in_planes)
        self.conv2 = nn.Conv2d(in_planes, in_planes, kernel_size=3, stride=stride, padding=1, groups=32, bias=False)
        self.bn2 = nn.BatchNorm2d(in_planes)
        self.conv3 = nn.Conv2d(in_planes, out_planes+dense_depth, kernel_size=1, bias=False)
        self.bn3 = nn.BatchNorm2d(out_planes+dense_depth)

        self.shortcut = nn.Sequential()
        if first_layer:
            self.shortcut = nn.Sequential(
                nn.Conv2d(last_planes, out_planes+dense_depth, kernel_size=1, stride=stride, bias=False),
                nn.BatchNorm2d(out_planes+dense_depth)
            )

    def forward(self, x): #假设输入x维度(3,32,32)
        out = F.relu(self.bn1(self.conv1(x)))
        out = self.layer1(out) #320*32*32（out_plane+(num_block+1)*dense_depth）
        out = self.layer2(out) #672*16*16
        out = self.layer3(out) #1528*8*8
        out = self.layer4(out) #2560*4*4
        out = F.avg_pool2d(out, 4)
        out = out.view(out.size(0), -1)
        out = self.linear(out)
        return out

大体的思路是：bottleneck的一条路线学习Resnet的shortcut，对x做维度对齐；一条路线学DenseNet，通过堆叠卷积模块1 * 1 conv->bn->relu->3 * 3 conv->bn->relu->1 * 1 conv->bn来扩大感受野，最后汇总两条路线的输出做concat，一层包含num_blocks个bottleneck，每层的输出通道数为out_plane+(num_block+1)*dense_depth。

有一个细节，3*3的卷积采用的是group操作，类似ResNeXt。

解释 `group conv`：

我们假设上一层的输出feature map有N个，即通道数channel=N，也就是说上一层有N个卷积核。再假设群卷积的群数目M。那么该群卷积层的操作就是，先将channel分成M份。每一个group对应N/M个channel，与之独立连接。然后各个group卷积完成后将输出叠在一起（concatenate），作为这一层的输出channel。这一操作适用于多GPU并行。

实验结果：

Figure 3，关于训练速度和存储空间的对比。现在对于模型的改进，可能准确率方面的提升已经很难作为明显的创新点，因为幅度都不大，因此大部分还是在模型大小和计算复杂度上优化，同时只要准确率还能提高一点就算进步了。

后续阅读路线

MobileNetV2

你可能感兴趣的:(CV)

LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
多线程之——ExecutorCompletionService 阿福德
在我们开发中，经常会遇到这种情况，我们起多个线程来执行，等所有的线程都执行完成后，我们需要得到个线程的执行结果来进行聚合处理。我在内部代码评审时，发现了不少这种情况。看很多同学都使用正确，但比较啰嗦，效率也不高。本文介绍一个简单处理这种情况的方法：直接上代码：publicclassExecutorCompletionServiceTest{@TestpublicvoidtestExecutorCo
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
ubuntu安装opencv最快的方法 Derek重名了
最快方法，当然不能太多文字$sudoapt-getinstallpython-opencv借助python就可以把ubuntu的opencv环境搞起来，非常快非常容易参考：https://docs.opencv.org/trunk/d2/de6/tutorial_py_setup_in_ubuntu.html
代码的执行效果高天
packagecom20210409;publicclassdemo04{publicstaticvoidmain(String[]args){//////&&当前的条件不满足,则最后结果一定不满足,后面的条件不再执行////&不管条件是否满足所有条件均作判断//intx=1,y=1;//if(++y==2&&x++==2){//x=7;//}//System.out.println("x="+x
使用Python和Playwright破解滑动验证码 asfdsgdf python 开发语言
滑动验证码是一种常见的验证码形式，通过拖动滑块将缺失的拼图块对准原图中的空缺位置来验证用户操作。本文将介绍如何使用Python中的OpenCV进行模板匹配，并结合Playwright实现自动化破解滑动验证码的过程。所需技术OpenCV模板匹配：用于识别滑块在背景图中的正确位置。Python：主要编程语言。Playwright：用于浏览器自动化，模拟用户操作。破解过程概述获取验证码图像：下载背景图和
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
Python OpenCV图像处理：从基础到高级的全方位指南极客代码玩转Python 开发语言 python opencv 图像处理计算机视觉
目录第一部分：PythonOpenCV图像处理基础1.1OpenCV简介1.2PythonOpenCV安装1.3实战案例：图像显示与保存1.4注意事项第二部分：PythonOpenCV图像处理高级技巧2.1图像变换2.2图像增强2.3图像复原第三部分：PythonOpenCV图像处理实战项目3.1图像滤波3.2图像分割3.3图像特征提取第四部分：PythonOpenCV图像处理注意事项与优化策略4
C# 禁止程序重复启动 wiseyao1219 c#
修改：Program.cs[STAThread]staticvoidMain(){Mutexmutex=newMutex(true,"NewGuid123456",outboolisCreatedNew);if(!isCreatedNew){MessageBox.Show(Application.ProductName+"isrunning...");return;}Application.Ena
2018-08-16【Swift 4.1】关于Swift4.0以后调用MJExtension无法模型转换问题码农happy
1、本人使用swift4.1，弄了一晚上才弄好，结果还是一个小问题真是尴尬，要在model中每个属性前面加上@objcimportUIKitclassUserModel:NSObject{@objcvardix=String()}letdic=["dix":"ffffff"]asNSDictionaryletmodel=UserModel.mj_object(withKeyValues:dic)!
python图像匹配_opencvpython中的图像匹配 weixin_39585675 python图像匹配
我一直在做一个项目，用opencvpython识别相机中显示的标志。我已经尝试过使用surf、颜色直方图匹配和模板匹配。但在这3个问题中，它并不总是返回正确的答案。我现在想要的是，解决我这个问题的最好办法是什么。模板图像示例：以下是摄像头中显示的标志示例。如果这是我想要识别的图像，该怎么用？在更新matchTemplate中的代码flags=["Cambodia.jpg","Laos.jpg","
利用Python+OpenCV实现截图匹配图像，支持自适应缩放、灰度匹配、区域匹配、匹配多个结果 xu-jssy Python自动化脚本 python opencv 开发语言图像处理自动化
可以直接通过pip获取，无需手动安装其他依赖pipinstallxug示例：importxugxug.find_image_on_screen(,,,)=========================================================================一、依赖安装pipinstallopencv-pythonpipinstallpyautogui二、获
day12 控制流程 if switch while do...while 猜数字游戏卓越小Y JAVA学习日志游戏 java 开发语言
控制流程顺序结构所有的程序都是按顺序执行if语句选择结构单选择语句if(a>0){System.out.println(“hello”);}packagecom.ckw.blog.select;importjava.util.Scanner;publicclassdemo01{publicstaticvoidmain(String[]args){intscore=0;Scannerscanner=
Vector和Stack的用法蟹道人 JavaSe java
/***作者：*日期：*功能：vector的用法*/packagecom.cg;importjava.util.*;publicclassDemo5{publicstaticvoidmain(String[]args){//Vector的使用Vectorvec=newVector();Empemp=newEmp("2011",25,"zhang");vec.add(emp);for(inti=0;
C#文件被占用的解决方案花北城 C#项目文件占用
问题打更新包时，提示文件被占用。System.IO.IOException:文件“D:\RS\RS_CCVI20111210.exe”正由另一进程使用，因此该进程无法访问该文件。在System.IO.__Error.WinIOError(Int32errorCode,StringmaybeFullPath)在System.IO.FileStream.Init(Stringpath,FileMode
数组拷贝Arraycopy xing2516 Arraycopy java
packageqing;//数组拷贝publicclassArraycopy{publicstaticvoidmain(String[]args){//一维数组拷贝Stringa[]={"小米","华为","阿里","腾讯","百度"};String[]aBak=newString[6];//从a数组第0个copy到数组aBak0个开始，长度是a数组长度System.arraycopy(a,0,a
discuz discuz_admincp.php 讲解,Discuz! 1.5-2.5 命令执行漏洞分析(CVE-2018-14729) weixin_39740419 discuz 讲解
0x00漏洞简述漏洞信息8月27号有人在GitHub上公布了有关Discuz1.5-2.5版本中后台数据库备份功能存在的命令执行漏洞的细节。漏洞影响版本Discuz!1.5-2.50x01漏洞复现官方论坛下载相应版本就好。0x02漏洞分析需要注意的是这个漏洞其实是需要登录后台的，并且能有数据库备份权限，所以比较鸡肋。我这边是用Discuz!2.5完成漏洞复现的，并用此进行漏洞分析的。漏洞点在：so
mysql 隐秘后门_【技术分享】CVE-2016-5483：利用mysqldump备份可生成后门 Toby Dai mysql 隐秘后门
预估稿费：100RMB投稿方式：发送邮件至linwei#360.cn，或登陆网页版在线投稿前言mysqldump是用来创建MySQL数据库逻辑备份的一个常用工具。它在默认配置下可以生成一个.sql文件，其中包含创建/删除表和插入数据等。在导入转储文件的时候，攻击者可以通过制造恶意表名来实现任意SQL语句查询和shell命令执行的目的。另一个与之相关的漏洞利用场景可以参考。攻击场景攻击者已经能够访问
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
解决mysql漏洞 Oracle MySQL Server远程安全漏洞(CVE-2015-0411) dieweidong5625 数据库运维 java
有时候会检测到服务器有很多漏洞，而大部分漏洞都是由于服务的版本过低的原因，因为官网出现漏洞就会发布新版本来修复这个漏洞，所以一般情况下，我们只需要对相应的软件包进行升级到安全版本即可。通过查阅官网信息，OracleMySQLServer远程安全漏洞(CVE-2015-0411)，受影响系统：OracleMySQLServer/usr/databases.sql//先备份原有所有数据，防止数据丢失。
opencv 学习 1 木木ainiks opencv 计算机视觉 python
opencv学习的第一天#coding:utf-8importcv2ascv#首先读图片src=cv.imread(“img/1.jpg”)#设置图片的名字cv.namedWindow(“1”,cv.WINDOW_AUTOSIZE)#显示图片第一个参数设置图片名，第二个参数图片的地址cv.imshow(“1”,src)cv.waitKey(0)#将图片写入固定位置cv.imwrite(“img/2
OpenCV结构分析与形状描述符（24）检测两个旋转矩形之间是否相交的一个函数rotatedRectangleIntersection()的使用 jndingxin OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述测两个旋转矩形之间是否存在交集。如果存在交集，则还返回交集区域的顶点。下面是一些交集配置的例子。斜线图案表示交集区域，红色顶点是由函数返回的。rotatedRectangleIntersection()这个函数看起来像是用于检测两个旋转矩形之间是否相交的一个方法。
python-opencv cv2.findContours()函数 fjswcjswzy opencv python笔记 python opencv
示例代码：image,contours,hierarchy=cv2.findContours(contour,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)输入：contour：带有轮廓信息的图像；cv2.RETR_TREE：提取轮廓后，输出轮廓信息的组织形式，除了cv2.RETR_TREE还有以下几种选项：cv2.RETR_EXTERNAL：输出轮廓中只有外侧轮廓信
【Python】【Opencv】cv2.findContours()、cv2.drawContours()和cv2.contourArea()函数详解和运行示例木彳 Python学习和使用过程积累 python opencv 开发语言人工智能计算机视觉
为帮助大家理解和使用cv2.findContours()、cv2.drawContours()和cv2.contourArea()函数，本文通过对函数内容进行详解，并通过运行示例更直观表述。函数解析cv2.findContours()cv2.drawContours()cv2.contourArea()运行示例运行示例示例详解函数解析cv2.findContours()cv2.findContou
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象

近年热门分类CNN网络结构的总结

LeNet

AlexNet

ZF-Net

VGG

谷歌系列 :Inception v1到v4

GoogLeNet（即Inception V1）

BN-GoogLeNet（即BN-Inception、Inception V2）

Inception V3

Inception V4

Resnet

残差指的是什么？

ResnetXt

SeNet

DenseNet

DPN

解释 group conv：

你可能感兴趣的:(CV)

解释 `group conv`：