MobileNet

mobilenet

主要思想

​ 将卷积分为两个更小的操作,depthwise convolution/pointwise convolution,降低计算量。深度可分卷积,将标准卷积分为深度卷积和1*1点式卷积,深度卷积在每个输入通道上应用一个滤波器(M),点式卷积组合深度卷积的输出;

MobileNet_第1张图片

输入M ·DF ·DF ,生成N ·DF ·DF 特征图;

标准卷积计算量:DK ·DK ·M ·N ·DF ·DF ;

分离卷积:DK ·DK ·M ·DF ·DF + M ·N ·DF ·DF ;

加速比:1/N+1/DK^2;

设置超参数让用户选择网络模型大小:

1、设置α,在每一层薄化网络,作用于通道数量上;

薄化网络后计算量:DK ·DK ·αM ·DF ·DF + αM ·αN ·DF ·DF ,α<=1;

2、设置ρ,减少相同的乘法器,作用与输入图像上;

减少乘法器计算量:DK ·DK ·αM ·ρDF ·ρDF + αM ·αN ·ρDF ·ρDF ,ρ<=1;

网络结构

MobileNet_第2张图片

11的是点式卷积,33dw是深度分离卷积,前面是标准深度卷积;

每一层后都有BN层和ReLU层;

1、shallower models:宽度不变,深度减少;

2、减少计算量,但保证了网络性能;

3、将mobilenet原理应用到更多的网络,证明此路可行;

mobilenet V2

主要思想

Linear Bottleneck:神经网络将高维信息嵌入到低维子空间,通过V1中的宽度因子α在计算量和精度取折中,但是由于非线性激活函数ReLU存在,可能会导致丢失大量信息;我们既压缩维度,又想要有足够的信息,因此选择用线性分类器;

在这里插入图片描述

Inverted Residuals:在深度卷积之前添加点式卷积,是因为之前的网络自己没有改变通道的能力,上一层给它多少通过到,如果上一层通道很少,深度卷积只能在低维空间提取特征;不同于残差块中间窄两头胖,先将低维空间映射到高维空间,然后作深度可分卷积,最后作线性激活函数;

构建块的输入/输出域和层转换之间提供了一个分离,输入/输出域是网络各层的容量,层转换时网络表达;

MobileNet_第3张图片

补充:ReLU在低维度空间中能保留完整的信息;

应用到目标检测:SSDLite;应用到语义分割,mobile DeepLabv3;

网络结构

膨胀率在5-8之间最好,实验用的6;

MobileNet_第4张图片

1、包含之前所有的卷积层和32个过滤器,然后是19个线性瓶颈层;
MobileNet_第5张图片

2、stride=2时,就不用捷径了,因为输入输出维度变化了;

MobileNet_第6张图片

你可能感兴趣的:(论文阅读,深度学习,神经网络,人工智能)