(科普快餐)语义分割经典论文--6:MobileNetV3(2019)

论文地址:http://openaccess.thecvf.com/content_ICCV_2019/papers/Howard_Searching_for_MobileNetV3_ICCV_2019_paper.pdf

意义

开发最佳的移动计算机视觉架构,优化移动设备上的精度权衡。为了实现这一点,引入了:

(1)互补搜索技术

(2)适用于移动环境的新型高效非线性

(3)新型高效网络设计

(4)新型高效分段解码器


改进

1. 加入SE模块(科普快餐)语义分割经典论文--6:MobileNetV3(2019)_第1张图片

 因为SE结构会消耗一定的时间,所以作者在含有SE的结构中,将expansion layer的channel变为原来的1/4,这样作者发现,即提高了精度,同时还没有增加时间消耗。

2. 修改尾部结构

在mobilenetv2中,在avg pooling之前,存在一个1x1的卷积层,目的是提高特征图的维度,更有利于结构的预测,但是这其实带来了一定的计算量了,所以这里作者修改了,将其放在avg pooling的后面,首先利用avg pooling将特征图大小由7x7降到了1x1,降到1x1后,然后再利用1x1提高维度,这样就减少了7x7=49倍的计算量。

为了进一步的降低计算量,作者直接去掉了前面纺锤型卷积的3x3以及1x1卷积,进一步减少了计算量,就变成了如下图第二行所示的结构,作者将其中的3x3以及1x1去掉后,精度并没有得到损失。这里降低了大约15ms的速度。

(科普快餐)语义分割经典论文--6:MobileNetV3(2019)_第2张图片

 3. 修改了channel数量

修改头部卷积核channel数量,mobilenet v2中使用的是32 x 3 x 3,作者发现,其实32可以再降低一点,所以这里作者改成了16,在保证了精度的前提下,降低了3ms的速度。作者提供了两个版本的v3,分别是large和small,对应于高资源和低资源的情况。两者都是使用NAS进行搜索出来的。

 4. 新激活函数

你可能感兴趣的:(深度学习,人工智能)