GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

原文链接:https://arxiv.org/pdf/1911.11907.pdf

代码:https://github.com/huawei-noah/ghostnet

主要思想

由于存储和计算资源的限制,卷积神经网络(CNNs)在嵌入式设备上的应用非常困难。特征映射的冗余性是这些成功的神经网络的一个重要特征,但在神经网络结构设计中却鲜有研究。本文提出了一种新的Ghost模块,可以从廉价的操作中生成更多的特征图。基于一组内在特征映射,以低廉的成本应用一系列线性变换来生成许多能充分揭示内在特征信息的ghost feature maps。论文提出的Ghost模块可以作为一个即插即用的组件来升级现有的卷积神经网络。Ghost bottlenecks用来堆叠Ghost模块,从而可以方便地建立轻量级GhostNet。在benchmarks上进行的实验表明,所提出的Ghost模块是baselines models中可以替代卷积层的好方法,并且GhostNet可以在ImageNet ILSVRC-2012分类数据集上以相似的计算成本实现比mobilenet3更高的识别性能(例如75:7%的top-1精度)。

提出背景

  1. 传统的CNN通常需要大量的参数和浮点运算(FLOPs)才能达到满意的精度;

  2. 尽管最近的工作,例如MobileNet和ShuffleNet引入了深度可分离卷积或混淆卷积操作,以使用较小的卷积核(浮点运算)来构建有效的CNN,但1x1卷积层仍将占用大量内存和FLOPs;

  3. MobileNet和ShuffleNet这类模型在较少FLOPs下获得了高性能,但特征映射之间的相关性和冗余性却从未得到很好的利用;

  4. 深度网络处理过的特征有一部分冗余,这类特征可以通过更廉价的方式获取,不一定非要传统代价较为高昂的运算方式;

创新点

  1. 引入了一种新的Ghost模块,通过使用较少的参数来生成更多的特征;

  2. Ghost深层神经网络中的一个普通卷积层将被分成两部分。第一部分涉及普通卷积,但它们的总数将受到严格控制,给定第一部分的内在特征映射,然后应用一系列简单的线性运算来生成更多的特征映射;

  3. 在不改变输出特征映射大小的情况下,与普通卷积module相比该Ghost模块所需的参数总数和计算复杂度相比减少了;

  4. 基于Ghost模块,本文建立了一个高效的神经网络结构:GhostNet;

  5. 实验结果表明,所提出的Ghost模块在保持相似识别性能的同时,能够降低通用卷积层的计算成本,在移动设备上快速推理的各种任务上,Ghost网络可以超过MobileNet3等最新的高效深层模型;

网络模型结构

论文提出了Ghost module,针对传统方式,设定输入数据维度为  ,卷积核为  ,其中  为卷积核大小,  为卷积核数量,设输出的feature map尺寸为  ,那么计算量为:  。

GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)_第1张图片

然而,输出的feature map中会有很多类似或者冗余的特征,如下图所示,这类冗余特征可以基于某个基础特征通过廉价的线性变换获得,下图的扳手是线性操作,箭头起点为基础特征,终点为冗余或相似特征。

GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)_第2张图片

论文的方法:设定每个基础特征对应  个冗余特征,那么只需要输出  个基础特征即可,然后对每个基础特征执行线性变换(论文采取  的卷积核进行运算),生成对应的冗余/相似特征即可,这样即可降低网络本身的FLOPs。相比于原有方式,FLOPs是原来的  。

GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)_第3张图片

GhostNet中的主要有两类bottleneck,主要由上述Ghost module堆积,Stride分别为1和2。

GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)_第4张图片

Ghost bottleneck 1结构类似于ResNet,集成了多个卷积层和shortcut,Ghost bottleneck1主要由两个堆叠的Ghost模块组成。第一个Ghost模块用作扩展层,增加了通道数。Ghost bottleneck2通过深度可分离卷积减少通道数,并使用shortcut连接输入和输出。

GhostNet网络结构:如下图所示,GhostNet通过Ghost bottleneck堆叠,并使用SE模块。

GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)_第5张图片

实验结果

为了验证所提出的Ghost模块和GhostNet架构的有效性,我几个基准视觉数据集上进行了实验,包括CIFAR-10、ImageNet ILSVRC 2012数据集和MS-COCO对象检测基准。针对d和s的大小,论文进行了实验,最终确定了d=3,s=2。

GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)_第6张图片

CIFAR-10上的实验对比:

GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)_第7张图片

ImageNet上的实验对比:

GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)_第8张图片

GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)_第9张图片

COCO数据集上的实验对比:

GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚)_第10张图片

上述内容,如有侵犯版权,请联系作者,会自行删文。

推荐阅读

吐血整理|3D视觉系统化学习路线

那些精贵的3D视觉系统学习资源总结(附书籍、网址与视频教程)

超全的3D视觉数据集汇总

大盘点|6D姿态估计算法汇总(上)

大盘点|6D姿态估计算法汇总(下)

机器人抓取汇总|涉及目标检测、分割、姿态识别、抓取点检测、路径规划

汇总|3D点云目标检测算法

汇总|3D人脸重建算法

那些年,我们一起刷过的计算机视觉比赛

总结|深度学习实现缺陷检测

深度学习在3-D环境重建中的应用

汇总|医学图像分析领域论文

大盘点|OCR算法汇总

重磅!3DCVer-知识星球和学术交流群已成立

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导,550+的星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

欢迎加入我们公众号读者群一起和同行交流,目前有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加群或投稿

你可能感兴趣的:(GhostNet : 轻量级网络模型,性能超越MobileNetV3(CVRP2020, 华为诺亚))