融合YOLOv5s与通道剪枝算法的奶牛轻量化个体识别方法
Light-weight recognition network for dairy cows based on the fusion of YOLOv5s and channel pruning algorithm
论文链接 知网链接 DOI链接
该文章讨论了奶牛花斑、光照条件、不同剪枝方法、不同剪枝率对准确率的影响。
引用格式:
许兴时,王云飞,华志新,等. 融合YOLOv5s与通道剪枝算法的奶牛轻量化个体识别方法[J].农业工程学报,2023, 39(15): 153-163 doi: 10.11975/j.issn.1002-6819.202303122XU Xingshi, WANG Yunfei, HUA Zhixin, et al. Light-weight recognition network for dairy cows based on the fusion of YOLOv5s and channel pruning algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2023, 39(15): 153-163 doi: 10.11975/j.issn.1002-6819.202303122
相关视频资料:超链接
https://www.bilibili.com/video/BV1ii4y1C75h/?vd_source=d68da64987fce61a59890c929d25cd3d
实时准确地识别奶牛个体身份是构建完善的奶牛精准养殖技术架构的先决条件。如何在快速精准识别奶牛个体的同时保证模型的轻量化是至关重要的。**本文提出了一种在低计算量和低参数量条件下快速准确识别奶牛个体身份的方法。**研究采用YOLOv5s作为原始模型,利用BN层中缩放因子对模型中通道的重要性进行判断并剪除不重要的通道,从而降低网络复杂度。为了更加有效地压缩模型,本研究在损失函数中增加稀疏损失项,实现模型通道的稀疏化。测试试验结果表明,剪枝后的模型平均精度mAP为99.50%,计算量为8.1 G,参数量为1.630 M,每秒帧数为135.14 帧。相比其他具有代表性的目标检测模型,本文方法拥有最小的模型复杂度。此外,相比其他模型,本文方法对奶牛斑纹特征依赖程度更低,在低照度条件下有着更加出色的表现。考虑该方法具有快速、准确、鲁棒、低计算量和低参数量的特点,在推进养殖场中奶牛精细化养殖方面具有巨大潜能。
本研究在这一部分的技术路线如下图所示。首先,利用手工标准的数据集训练奶牛个体识别YOLOv5s网络。其次, 对已得到的奶牛个体识别YOLOv5s网络进行稀疏训练、通道剪枝和微调操作,最终在保证准确度的前提条件下,减小模型大小、提高运行速度,最终实现实时准确的多目标奶牛个体识别。
选用YOLOv5s作为基础网络。
按照功能,网络结构可分为Backbone、Neck、Head三部分。Backbone主要由Focus、Conv和C3组成,作用是将图像中信息进行提取并供后面的网络使用。Neck的作用是将提取出的特征进行融合与强化。由于高层特征图感受野大,相较于低层特征图通常语义信息更强,位置信息较差,为了强化语义信息和特征信息的融合,YOLOv5采取FPN+PAN结构搭建Neck。Head部分的作用是利用之前所得到的特征实现检测。
为获得用于奶牛个体识别的YOLOv5s网络, 2509张图像和2509个对应的标签文件所组成的训练集被使用。本研究在训练YOLOv5 时设定的参数如表3所示,为减小网络训练时的运算量,本文将训练集图像尺寸缩小为640px×640px,batch-size大小设定为8,选取随机梯度下降算法(SGD)对模型进行调优,初始学习率设置为0.001,并使用余弦退火衰减算法对学习率更新调整,类别数设置为91,epoch的数量设定为300。模型每经历一个epoch后,用验证集对当前模型效果进行评估,并保存本次训练得到的权重文件。模型训练结束后,保留模型训练效果最好的权重文件。
在YOLOv5s网络训练的过程中,模型首先需要进行前向传播计算损失值,其次通过反向传播更新模型参数使损失值逐步降低,实现预测结果与实际标签之间差距的逐步接近。本研究中YOLOv5的损失值由分类损失、定位损失和置信度损失三个部分组成,分类损失使用BCE Loss计算物体的真实类别概率和预测类别概率之间的差异;定位损失使用GIOU_loss来衡量预测框和B-Box之间大小和位置的偏差程度;置信度损失使用BCE Loss来量化模型能够正确判断物体是否存在的能力。
在检测时,模型首先根据预测框的置信度判断该预测框内是否存在目标,并保留存在目标的预测框。接着,利用非极大值抑制算法筛选预测框,避免同一目标被重复标记。最后根据筛选后预测框的类别概率定义目标的类别。
利用通道剪枝算法实现快速轻量的个体识别
巨大的参数量带给模型强大的学习能力和表达能力,但这些参数对于模型最终性能的作用并不相同(论文:Pruning is All You Need)。在保证模型准确率的前提条件下剪除网络中作用不大的参数,进一步减小模型大小、提高检测速度十分必要。权重剪枝算法灵活性高但需要特殊的硬件来加速,相反,整层剪枝算法易于实现但极易剪掉一些重要的参数(论文:networksliming)。为了兼顾剪枝算法的灵活性和实施成本,一些学者尝试对模型中不重要的通道进行剪枝并取得很好效果(DandanWanga DongjianHe_BE;Dihua_computer; Shuxiang Fan_computer)。
在YOLOv5s模型上实现通道剪枝需要借助网络的BN层。BN层被认为能够有效提高网络泛化能力、加快网络训练速度、解决“Internal Covariate Shift”问题。BN层的具体操作如论文中所示。
式中,规模因子γ、偏置因子β是可学习参数,它们通过网络训练得到。γ越接近于0,对应的通道对结果的影响程度越小,相反,当γ的值越大,对应的通道就越重要。由于规模因子γ可以有效地表示一个通道的重要性,通道剪枝算法通过判别γ值的大小实现剪枝。如图4所示,通道剪枝算法首先通过稀疏训练使BN层中的参数γ趋向于0,之后,保留贡献度高的通道并剪除贡献度较小的通道,实现模型的压缩。图4中的公式中(x,y)为训练数据集的样本点,W为模型权重,Σ_((x,y) ) L(f(x,W),y)为模型的原始损失函数,λ为稀疏权重因子,g(γ)为稀疏损失项,γ为规模因子,α为通道重要性阈值。
本研究中通道剪枝算法具体步骤如下:
步骤1:通道稀疏训练
由于在原始网络的BN层中,γ近于0的情况很少,直接对网络的通道进行剪枝很难有效地压缩模型。为解决这一问题,需要对模型BN层中的γ值进行稀疏训练。本研究选取2.2.1节中模型效果最好的权重文件作为用作稀疏训练的原始网络权重文件,训练时通过在正常训练的损失函数基础上添加对γ的L1正则化约束项实现模型的通道稀疏化。
训练过程中使用ADAM作为优化器用于更新模型参数,初始学习率设定为0.0005,稀疏权重因子λ设定为0.015。如图所示,模型经过200个epoch后,参数γ的分布中心接近于0且不再发生明显变化,模型已完成稀疏化训练。
步骤2:剪除低贡献度通道
稀疏化训练完成后,设定通道重要性阈值α,对参数γ没有超过α的通道进行剪除。过小的剪枝率不利于模型压缩,过大的剪枝率可能会严重影响模型性能。本研究中α的最佳大小由多次实验确定。如图6所示,本研究对59个BN层中的9632个通道的重要性进行判断,在保证模型性能没有严重退化的条件下裁剪掉5324个通道。
步骤3:对剪枝后的模型进行微调
剪枝后模型大小和参数量的大幅度减小会带给模型一定程度上的精度损失,为减轻通道剪枝算法带来的负面影响,本研究对剪枝后的模型进行微调。由于剪枝后的模型相对较小,学习能力相对较弱,需要更多的迭代次数恢复精度。本文微调过程中选用随机梯度下降算法作为优化算法,初始学习率设置为0.001,并使用余弦退火衰减算法对学习率更新调整, epoch设定为350。
实验结果