基于YOLOv5的口罩佩戴检测方法

摘 要

正确的佩戴口罩对现阶段有效减低人员之间感染新型冠状病毒具有重要意义。基于YOLOv5在图像识别检测领域的优异性能,本文研究基于基于YOLOv5的口罩佩自动戴检测方法。首先从网络和真实生活中中寻找并采集不同场景人群口罩佩戴的图片约500张并自建数据集,然后利用YOLOv5模型框架,修改其相关配置文件和检测参数,并采用数据增强和Dropout技术防止过拟合。实验结果验证了YOLOv5模型人群口罩佩戴图像识别任务上的优越性能,测试集上的YOLOv5s模型识别准确率高达85.45%。
关键词 图像识别;口罩佩戴检测;YOLOv5;特征学习;

引言

自2019年以来,新型冠状病毒肺炎袭击全球,影响着人们的生命安全,我国采取了强有效的防控措施,在抗击新冠肺炎方面取得了较大的成功,但我们依然不能松懈,在人流量密集的机场,车站和市场等,稍有不慎就有传播风险。正确的佩戴口罩是现阶段有效减低人员之间感染的有效措施之一,而佩戴口罩进行检测也是需要一定的检测技术,目前口罩佩戴检测存在着因周围复杂环境影响从而出现效率低,导致漏检等情况。为了达到更好的检测效果,本文主要是利用YOLOv5网络模型在轻量化口罩佩戴检测算法的研究。

1 数据预处理

1.1 数据采集

人群口罩佩戴图像是2022年5月23日,由本组三名同学分别在网络上以及在真实场景中用手机拍摄所得,共计1027张图片。不同采集设备获取的原始图像分辨率不同,在数据建模时统一缩放至324×324大小的规格
表1 数据采集信息
编号 相机分辨率 手机型号 图像数目
1 2532 x 1170 Iphone12 250
2 2532 x 1170 IPhone13 325
3 4000 x 3000 Xiaomi 10S 301
基于YOLOv5的口罩佩戴检测方法_第1张图片

(a) 口罩佩戴样式
基于YOLOv5的口罩佩戴检测方法_第2张图片
(b) 口罩种类
图1. 口罩佩戴样式数据展示

1.2 数据增强

为了提高卷积神经网络模型的泛化能力,对每幅口罩佩戴图像通过旋转、平移、扭曲、缩放、翻转等传统数字图像处理方法进行随机变换以扩充样本个数。某幅口罩图像进行数据增强后的部分样本如图2所示,通过随机变换生成的口罩佩戴图像大量扩充了数据集,使样本分布更广泛。
基于YOLOv5的口罩佩戴检测方法_第3张图片

图 2 数据增强后的部分图像样本

2 检测模型

本文采用YOLOv5构建目标口罩检测模型,其御用多个残差组件使得网络模型网络的不断加深,直接增加网络特征提取和特征融合的能力。

2.1 网络结构

本文构建的识别模型主要是YOLOv5s,其具有小型轻量,快速的特点,适合于快速准确的识别任务。模型如图3-1。
模型输入图像设定为324×324 的三通道彩色图像,残差结构中依次包含瓶颈残差模块、常规残差模块×2、瓶颈残差模块、常规残差模块×3、瓶颈残差模块、常规残差模块×22、瓶颈残差模块、常规残差模块×2。其内部卷积核设置略有调整。最后,在网络全连接层之后采用Softmax分类器输出每个类别的分类概率。
基于YOLOv5的口罩佩戴检测方法_第4张图片

图3-1YOLOv5识别网络图示

3 实验

3.1 实验设置

在图像检测实验中,测试了不同的网络架构在不同的参数下表现出来的效果。改造模型结构的方法:改变YOLOv5中自带三种模型,观察在相同参数下三种模型检测的准确率。
实验编程开发环境为PyCharm Community Edition 2021.1, 计算设备为个人计算机, CPU为Intel® Core™ i7-1065G7,主频为1.30GHz,内为8GB,显卡为NVIDIA GeForce MX230,显存为4GB。训练数据和测试数据的划分比例为9:1。

3.2 实验结果

3.2.1 最佳实验结果
首先,将全部人群口罩图像数据集合并在一起,随机分层抽样90%作为训练集,其余10%作为测试机,随机打乱顺序读入,训练过程中每次迭代随机打乱一次,训练5次,每次训练后验证一次,数据增强方法是上下左右随机移动20个像素,x轴随机反射。识别准确率如表3所示。其中YOLOv5x训练集准确率最高但训练耗时132分51秒, YOLOv5l训练耗时105分43秒,YOLOv5s训练耗时78分34秒。从资源消耗与收益比来看,YOLOv5s性能较强。YOLOv5x泛化能力较差,存在过拟合的问题且训练过程振荡较为严重。
表3. 最佳的识别结果
算法名称 训练准确率 测试准确率
YOLOv5x 100 97.87
YOLOv5l 99.87 95.55
YOLOv5s 98.32 94.68

4 结论

本文采用YOLOv5检测网络模型建立人群口罩佩戴检测模型,用于自动检测不同场景中流动人群口罩佩戴情况。首先,在互联网百度图库中共找151张人群口罩佩戴情况图像,接着从身边不同场景中拍摄人群口罩佩戴情况图像共计876张。总计1027张。并人工标注人群口罩佩戴情况;随后YOLOv5模型架构,迁移学习了一种卷积神经网络,测试集上的识别准确率可达98%,在不同场景中,对不同角度,不同口罩类型有极高的识别准确率,整体表现较好,对于新冠疫情防控具有一定的实际意义。
为了提高大场景下大规模人群口罩佩戴检测的准确率、时效性和鲁棒性,下一步工作将继续优化网络结构和参数,加入卷积模型,提升整体精度,改造数据集内容,结合特征学习的层次化表示思想,将特征迁移、特征学习和人工特征相结合来构建易于训练的深度学习模型。

参 考 文 献

[1] 王莉茹.基于YOLOv5s的口罩佩戴检测[J]. 西藏科技,2022(05):65-67.
[2] 张路遥,韩华.基于YOLOv5s的人脸是否佩戴口罩检测[J].智能计算机与应用,2021,11(09):196-199.
[3] 谈世磊,别雄波,卢功林,谈小虎.基于YOLOv5网络模型的人员口罩佩戴实时监测[J].激光杂志,2021,42(02):147-150.
[4] 王沣.改进yolov5的口罩和安全帽佩戴人工智能检测识别算法[J].建筑与预算,2020(11):67-69.
[5] 王欣然,田启川,张东.人脸口罩佩戴检测研究综述[J].计算机工程
欢迎大家加我微信交流讨论(请备注csdn上添加)
基于YOLOv5的口罩佩戴检测方法_第5张图片

你可能感兴趣的:(努力学习人工智能,学习笔记,技术文章,计算机视觉,人工智能,深度学习)