论文笔记:5-2022-Ruoli Yang-Hindawi-Fruit Target Detection Based on BCo-YOLOv5 Model

摘要:

深度学习诞生后,人工智能进入了蓬勃发展的蓬勃时期。在这个上升和成长的过程中,我们取得了一项又一项的成就。将深度学习应用于水果目标检测时,由于识别背景复杂、模型间相似度大、纹理干扰严重、水果部分遮挡等问题,基于传统方法的水果目标检测率较低。为了解决这些问题,提出了一种BCo-YOLOv5网络模型来识别和检测果园中的水果目标。我们使用 YOLOv5s 作为特征图像提取和目标检测的基本模型。本文将BCAM(双向交叉注意力机制)引入到网络中,并在YOLOv5s基础模型的骨干网络和颈部网络之间加入了BCAM。BCAM使用权重乘法策略和最大权重策略构建更深的位置特征关系,可以更好地辅助网络检测水果图像中的水果目标。经过网络训练和测试,map BCo-YOLOv5网络模型达到97.70%。为了验证BCo-YOLOv5网络对柑橘、苹果、葡萄等水果目标的检测能力,我们进行了大量的BCo-YOLOv5网络实验。BCo-YOLOv5网络的实验结果表明,该方法可以有效检测水果图像中的柑橘、苹果和葡萄目标,基于BCo-YOLOv5网络的水果目标检测方法优于大多数果园水果检测方法。可以更好地辅助网络检测水果图像中的水果目标。经过网络训练和测试,map BCo-YOLOv5网络模型达到97.70%。为了验证BCo-YOLOv5网络对柑橘、苹果、葡萄等水果目标的检测能力,我们进行了大量的BCo-YOLOv5网络实验。BCo-YOLOv5网络的实验结果表明,该方法可以有效检测水果图像中的柑橘、苹果和葡萄目标,基于BCo-YOLOv5网络的水果目标检测方法优于大多数果园水果检测方法。可以更好地辅助网络检测水果图像中的水果目标。经过网络训练和测试,map BCo-YOLOv5网络模型达到97.70%。为了验证BCo-YOLOv5网络对柑橘、苹果、葡萄等水果目标的检测能力,我们进行了大量的BCo-YOLOv5网络实验。BCo-YOLOv5网络的实验结果表明,该方法可以有效检测水果图像中的柑橘、苹果和葡萄目标,基于BCo-YOLOv5网络的水果目标检测方法优于大多数果园水果检测方法。和其他水果目标一样,我们进行了大量的BCo-YOLOv5网络实验。BCo-YOLOv5网络的实验结果表明,该方法可以有效检测水果图像中的柑橘、苹果和葡萄目标,基于BCo-YOLOv5网络的水果目标检测方法优于大多数果园水果检测方法。和其他水果目标一样,我们进行了大量的BCo-YOLOv5网络实验。BCo-YOLOv5网络的实验结果表明,该方法可以有效检测水果图像中的柑橘、苹果和葡萄目标,基于BCo-YOLOv5网络的水果目标检测方法优于大多数果园水果检测方法。

背景:

近年来,人工智能的发展为各个领域提供了新的处理方法和先进的计算机视觉技术[ 1-3 ]。我们也在不断探索农业技术的新方向。随着智慧农业的普及,农业智能化发展迅速。其中,柑橘、苹果、葡萄等水果采摘技术和水果病害检测的机器人成为研究热点[ 4 , 5]。水果目标的快速准确识别和检测对于实现果园行业的自动采果、果实产量预测和智能管理具有重要意义。水果目标的识别和检测是采摘机器人采摘作业有效性的基本保证。因此,在自然环境中,如何有效识别柑橘类水果并准确定位其空间位置是提高柑橘类自动采摘系统可用性的关键技术。

国内外研究现状:

近年来,针对水果目标检测问题[ 6 ],提出了很多基于传统机器学习的解决方案。熊等人。[ 7 ]使用K-means聚类算法对柑橘类水果进行分割。根据图像分割结果,确定果实位置。然而,当环境复杂时,这种方法的分割效果并不理想。传统的机器视觉算法往往鲁棒性较差,复杂场景中水果目标的定位往往不准确。近年来,卷积神经网络逐渐应用于农业检测领域,并逐渐展现出极大的算法优势。地标算法包括 R-CNN [ 8 ]、Faster R-CNN [ 9]、SSD [ 10 ] 和 YOLO [ 11 ]。贾等人。[ 12 ]提出了一种基于掩码区域的Mask R-CNN网络来识别和分割重叠的苹果,并使用全卷积网络(FCN)生成掩码来检测苹果的位置。胡等人。[ 13 ]提出了一种基于空间域注意力机制和PDAM-STPNET的森林烟雾目标检测网络,以YOLOXL为基本模型。胡等人。[ 14 ]利用Fast R-CNN提取番茄特征,在复杂温室环境中识别和定位候选成熟番茄区域,判断番茄果实成熟度。薛等人。[ 15 ] 改进了 YOLOv2 [ 16] 并提出了一个带有密集块的微型 Yolo 网络来检测和识别未成熟的芒果。田等人。[ 17 ]改进了YOLOv3网络,利用改进后的YOLOv3-dense网络对未成熟苹果、臃肿苹果和成熟苹果的图像进行检测。实验证明,YOLOv3-dense模型可以有效检测不同状态的苹果果实目标,并在一定程度上与苹果果实目标的检测重叠。

为解决网络识别准确率低的问题,大多数学者采用多种不同特征的注意力机制来提高网络识别的准确率。陈等人。[ 18 ]在番茄叶片病害识别网络中增加了双通道残差注意力网络模型(B-ARNet),用于识别番茄病害图片中的病斑。他们对 8616 张番茄图像的应用表明,在添加 B-ARNet 注意力机制后,网络的整体检测准确率约为 89%。证明了B-ARNet在番茄病害识别网络中发挥了积极作用。

本文的贡献:

我们使用 YOLOv5s 作为特征图像提取和目标检测的基本模型。在 YOLOv5s 基础模型的骨干网和颈网之间增加了 BCAM。BCAM采用权重乘法策略和最大权重策略,构建更深的位置特征关系,提高网络对柑橘、苹果、葡萄等水果目标的检测精度。关注图中不同方向的特征响应部分,可以减少特征的冗余,增强网络不同维度的特征学习能力。

我们在公共数据集上训练了我们的 BCo-YOLOv5 网络,并在自制数据集上验证了 BCo-YOLOv5 网络。验证结果表明,BCo-YOLOv5网络模型的检测准确率分别达到97.70%。本文提出的针对复杂环境下水果目标的BCo-YOLOv5目标检测网络,可以有效提高YOLOv5s基础网络的检测精度,也可以有效地检测出被阻塞的水果或小目标水果。

数据来源和处理:

公共数据集包括从 COCO 数据集 [ 19 ] 下载的苹果和柑橘数据集。在 COCO 公共数据集网站上精心挑选了 254 和 282 个标记的苹果和柑橘图像;从 Winegrape [ 20 ] 公共数据集中选择了 266 个带标签的葡萄图像。

另一部分与中南林业科技大学合作。影像数据采集自中南林业科技大学与长沙市林业局共建的经济林果产学研基地。相机型号为佳能EOSR,图像像素为2400*1600。我们使用相机拍摄不同种类的果园作物的光学图像。拍摄的背景是果园的复杂背景。这样的照片可以反映果园果实生长的许多复杂情况,从而保证采集到的图像更具代表性。在真实场景中收集了155、123和149张苹果、橙子和葡萄的图像。

我们使用四种方式来扩展标注数据集:旋转、翻转、随机裁剪和亮度变换。最终在数据库中获得了 4916 幅标记图像。

 论文笔记:5-2022-Ruoli Yang-Hindawi-Fruit Target Detection Based on BCo-YOLOv5 Model_第1张图片

论文笔记:5-2022-Ruoli Yang-Hindawi-Fruit Target Detection Based on BCo-YOLOv5 Model_第2张图片

 论文笔记:5-2022-Ruoli Yang-Hindawi-Fruit Target Detection Based on BCo-YOLOv5 Model_第3张图片

论文笔记:5-2022-Ruoli Yang-Hindawi-Fruit Target Detection Based on BCo-YOLOv5 Model_第4张图片

 

 

 

你可能感兴趣的:(深度学习,计算机视觉,人工智能)