GAN论文阅读(一)

GAN论文阅读(一)

  • 题目
  • 摘要
  • 引言
  • 材料与方法
    • 材料
    • 方法
  • 实验
    • 评价指标
    • 数据增强结果
    • *YOLOV3-dense*模型的性能
  • 小结(附论文中参考文献)

题目

Detection of Apple Lesions in Orchards Based on Deep Learning Methods of CycleGAN and YOLOV3-Dense

原文链接下载

摘要

提出了一种基于深度学习的炭疽病检测方法。首先,针对苹果病害的随机发生导致图像数据不足的问题,在传统图像增强技术的基础上,采用CycleGAN深度学习模型完成数据的增强。在图像数据增强的基础上,利用densely connected neural network(DenseNet)对YOLO-V3模型中分辨率较低的特征层进行优化。实验证明,改进的模型超过带有VGG16的Faster R-CNN网络、原始YOLO-V3模型和其他三个最先进的检测网络。该方法可以很好地应用于果园苹果表面炭疽病的检测。

引言

Inappropriate farming decisions result in the waste of labors and resources, and plant diseases cannot be well controlled.

  1. 不适当的农业决策导致劳动力和资源的浪费,植物病害无法得到很好的控制。

In our previous work, a BP neural network improved by genetic algorithm was applied to realize multithreshold image processing. The region of green apple in the image was segmented, and the lesion area was extracted by subsequent SVM method. The diseased apple was further identified [10]. This method has been well applied in the images collected in orchards but could not achieve realtime image processing.

  1. 在之前的工作中,我们利用遗传算法改进的BP神经网络来实现多阈值图像处理。对图像中的青苹果区域进行分割,然后采用后续的SVM方法提取病变区域。病苹果进一步鉴定为[10]。该方法在果园采集的图像中得到了很好的应用,但不能实现图像的实时处理

However, because Faster RCNN [21] and other R-CNN models include two procedures of region proposal generation and classification, the model cannot realize real-time detection.

  1. 但是,由于Faster R-CNN和一些其他的R-CNN模型包含区域建议生成和分类两个程序,该模型无法实现实时检测。

In our previous work [26], DenseNet was utilized to substitute the low resolution feature layers in YOLO network. The detection performance was therefore improved.

  1. 在我们之前的工作中,我们使用DenseNet来替代YOLO网络中的低分辨率特征层。从而提高了检测性能。

Because the incidence of apple disease is relatively random, it is very difficult to acquire a large number of specific disease images. To overcome this deficiency, CycleGAN deep learning method is adopted to expand the datasets in this paper.

  1. 由于苹果病害的发病率相对随机,很难获得大量具体病害的图像。为了克服这一不足,本文采用CycleGAN深度学习方法对数据集进行扩展。

CycleGAN can learn the features of one type of images and transplant them to another. By this means, features of apple lesion images can be extracted and transplanted to healthy apple images. Hence, the dataset of diseased apple images is enlarged.

  1. CycleGAN可以学习一种图像的特征,并将其移植到另一种图像上。通过这种方法,可以提取苹果病变图像的特征,并移植到健康苹果图像中。因此,患病苹果图像的数据集被放大。

材料与方法

材料

使用两类数据,500张健康苹果和140张患病苹果(anthracnose)。采用传统的图像增强技术和CycleGAN深度学习方法对患病苹果图像进行预处理和扩展。最终将患病类别图像扩展到传统方法即颜色、角度和亮度变换来处理原始图像。
GAN论文阅读(一)_第1张图片为了更好地比较不同检测模型的性能,将最终的训练集图像制成Pascal VOC的格式。

方法

YOLOV3-dense模型
GAN论文阅读(一)_第2张图片 在神经网络的训练过程中,卷积和降采样操作减小了特征层的大小,导致特征丢失。为了更有效地利用这些特征,并使其损失最小化,DenseNet采用前馈的方法将每一层连接到每一层。对原文Darknet-53架构进行了改进。采用DenseNet代替尺度较小的特征层。当特性传输到这些层时,它们将被DenseNet中的多个特性层重用,从而减少损失。

实验

评价指标

评价指标 描述
Precision-Recall (P − R) Curve and F1 Score 用于评估目标检测模型的性能
IoU 用于评价bounding box精确度的参数
Loss Value 用于评估神经网络在训练时的收敛情况
Average Detection Time 分析其实时性

数据增强结果

传统数据增强color/bright/angle)
GAN论文阅读(一)_第3张图片
CycleGAN增强结果
GAN论文阅读(一)_第4张图片

YOLOV3-dense模型的性能

GAN论文阅读(一)_第5张图片
GAN论文阅读(一)_第6张图片GAN论文阅读(一)_第7张图片GAN论文阅读(一)_第8张图片

小结(附论文中参考文献)

这项工作通过使用CycleGAN做数据增强,对其网络没有改动。使用改进的YOLO-V3检测模型,替换了特征提取层为DenseNet。优点:对比实验完整。
可供参考的对CyclGAN原论文的解读
对抗神经网络CycleGAN论文解读
GAN学习历程之CycleGAN论文笔记

Q. Li, M. Wang, and W. Gu, “Computer vision based system for apple surface defect detection,” Computers and Electronics in Agriculture, vol. 36, no. 2-3, pp. 215–223, 2002.

你可能感兴趣的:(论文阅读专栏(2020年))