谷歌开源移动端视觉识别模型:MobileNet

    项目地址:https://github.com/tensorflow/models/blob/master/slim/nets/mobilenet_v1.md


    近日谷歌发布了 MobileNet 网络架构,它是一系列在 TensorFlow 上高效、小尺寸的移动优先型视觉模型,其旨在充分利用移动设备和嵌入式应用的有限的资源,有效地最大化模型的准确性。MobileNet 是小型、低延迟、低功耗的参数化模型,它可以满足有限资源下的各种应用案例。它们可以像其他流行的大规模模型(如 Inception)一样用于分类、检测、嵌入和分割任务等。


应用案例包括目标检测、细粒度分类、人脸属性和地标识别等。


该版本可在 TensorFlow 中使用 TF-Slim 对 MobileNet 模型进行定义,同样还有 16 个预训练 ImageNet 分类保存点(checkpoints)以适用于所有大小的移动项目。这些模型可以借助 TensorFlow Mobile 在移动设备上高效地运行。


我们需要选择正确的 MobileNet 模型以符合所需的延迟和模型大小。内存和磁盘上的神经网络规模和参数的数量成正比。神经网络的延迟和功率大小与乘积累加(Multiply-Accumulates/MAC)数量成比例调整。MAC 度量了融合乘法和累加运算操作的数量。Top-1 和 Top-5 精度是在 ILSVRC 数据集上度量的。


MobileNet 权衡了模型的延迟、规模和准确度。



该版本可用 TF-Slim 对 MobileNet 模型进行定义。而TF-slim 是用于定义、训练和评估复杂模型的 TensorFlow(tensorflow.contrib.slim)轻量级高层 API。其 Github 目录包含使用 TF-slim 训练和评估几种广泛使用的卷积神经网络(CNN)图像分类模型的代码,同时还包括脚本以允许从头开始训练模型或微调预训练模型。


谷歌表明他们很高兴能将 MobileNet 分享到开源社区中,读者也可以阅读以下资源进一步了解 MobileNet:


  • 使用该模型库的更多信息可以阅读 TensorFlow-Slim Image Classification Library :https://github.com/tensorflow/models/blob/master/slim/README.md

  • 如何在移动设备上运行模型可以阅读 TensorFlow Mobile:https://www.tensorflow.org/mobile/


更详细的内容可阅读以下论文。


论文:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications


论文链接:https://arxiv.org/abs/1704.04861v1

你可能感兴趣的:(目标检测)