GoogLeNet分类结构(V1、V2)

1.算法思想

         GoogleLeNet是在AlexNet、VGG分类网络之后出现的新的分类网络,其解决的问题获得更加高级的特征且同时减少训练参数。

         GoogLeNet共有22层(卷积),其中包含9个线性堆叠的Inception模块,且在最后一个Inception模块处使用全局平均池化。

2.InceptionV1结构

GoogLeNet分类结构(V1、V2)_第1张图片

        首先对前层特征图进行1*1卷积操作,用于降低通道数量,减少训练参数;之后使用不同大小的卷积核进行卷积操作,最后,按通道合并各特征图。

3.算法特点

       1.若想获得更加高级的特征,以往的方式是增加网络的深度,而GoogLeNet则是通过增加网络的宽度来实现此目的。

       2.Inception模块综合考虑多个卷积核的运算结果,获得输入图像的不同信息,获得更好的图像表征。

       3. 为了阻止GoogLeNet网络结构(https://arxiv.org/pdf/1409.4842v1.pdf)中间部分梯度消失过程,作者引入了两个辅助分类器。它们对其中两个 Inception 模块的输出执行 softmax 操作,然后在同样的标签上计算辅助损失。总损失即辅助损失和真实损失的加权和。该论文中对每个辅助损失使用的权重值是 0.3,真是损失权重是1.其中,辅助损失仅用于训练,而不用于预测过程。

4.InceptionV2结构

GoogLeNet分类结构(V1、V2)_第2张图片GoogLeNet分类结构(V1、V2)_第3张图片

        InceptionV2首先是将InceptionV1中5*5卷积和替换为两个3*3卷积核,因为一个5*5卷积和两个3*3卷积可获得相同感受野的图像信息,但是却可以减少训练参数;之后将3*3的卷积和分解为1*3和3*1两个卷积,这种结构仍可以减少训练参数。

 

你可能感兴趣的:(计算机视觉)