论文阅读—嵌入 SENet 结构的改进 YOLOV3 目标识别算法

期刊:计算机工程
发表时间:2019.11

0. 平台配置

  • 本文实验搭建的开发平台配置为: CPU选用Intel® Core™ i7-8700,GPU选用NVIDIA GeForce GTX 1080Ti,操作系统选用 Ubuntu 16.04LTS,深度学习框架为 Pytorch。

1.这篇文章要解决什么问题

  • 提升对工业零件图像识别的查准率(P),减弱图像边缘残缺零件的干扰。

2.用了什么创新方法

  • 结合K-means聚类与粒子群优化算法进行锚框计算,加速收敛
  • 对YOLOv3网络嵌入SE结构。作者将改进的YOLOv3网络命名为:SE-YOLOv3

3.作者骄傲的结论是什么

  • 该算法能够获得平均交并比为83.01% 的锚框,有效减少假正例数量,其查准率与查全率分别为90.39%和93.25%,查准率相比YOLOv3网络提升了19.19%

4.这篇文章的不足

  • 查全率(RP)相比YOLOv3降低了4.26%
  • 由于增加了SE结构,增大了网络参数,从而导致FPS降低(训练速度变慢)

5.SE-YOLOv3网络结构图
论文阅读—嵌入 SENet 结构的改进 YOLOV3 目标识别算法_第1张图片

  • 基于 YOLOv3 在 darknet53 的每个残差结构后加入SE结构

6.SE结构
在这里插入图片描述

  • SE结构是SEnet网络的核心,主要目的是从卷积核的channel角度对卷积核施加权重
  • 作用是增强图片特征

7.改进锚框算法

  • 为得到适用于上述数据集的锚框,本文设定粒子数为 20 并随机初始化前 19 个粒子,采用 K-means 算法迭代 3 000 次,将结果作为第 20 个粒子的位置,使用 PSO 迭代 1000次。 论文阅读—嵌入 SENet 结构的改进 YOLOV3 目标识别算法_第2张图片

8.实验结果分析
论文阅读—嵌入 SENet 结构的改进 YOLOV3 目标识别算法_第3张图片
论文阅读—嵌入 SENet 结构的改进 YOLOV3 目标识别算法_第4张图片
论文阅读—嵌入 SENet 结构的改进 YOLOV3 目标识别算法_第5张图片

你可能感兴趣的:(神经网络,深度学习)