DB Face详解

        DB Face人脸检测模型:模型小,速度快,精度高且是基于anchor free思想进行设计的。

        从整体上来看,可以分为输入,特征提取以及输出三个部分。DB Face详解_第1张图片

网络结构

        DB Face有三种网络结构,三种网络结构的大小依次递减,其推理的速度随网络参数的减少而增快,但精度也会有所下降。可以根据实际的需求来选择所需要的网络。

        首先来看BackBone部分,DB Face的BackBone部分采用了Mobile Net V3。

Mobile Net

        Mobile Net V1采用了深度可分离卷积的结构

        这里展示的是普通卷积将12*12*3的图像卷积为8*8*256的过程

        而深度可分离卷积的过程则由下图所示

 

        而深度可分离卷积的优势就是可以大大的减少卷积运算的参数量,加快卷积运算的速度 

        Mobile Net V2 是在V1版本上进行的优化。

        可以看到在V2中的第二部分依旧采用了深度可分离卷积。第一部分是采用1*1的卷积操作通道将低维的特征映射到高维。这样操作可以在第二部分进行卷积时提取到更多的特征第三部分则是将通道再次还原回去,并最终做了残差结构

DB Face详解_第2张图片

        Mobile Net V3 

        V3版本采用了V1中的深度可分离卷积以及V2中的残差结构,并且引入了注意力机制

        由1*1卷积将低维特征映射到高维特征,3*3深度可分离卷积,在经过1*1卷积进行还原,最后利用注意力机制进行优化。

SE注意力机制:通过自动学习的方式,即使用另外一个新的神经网络,获取到特征图的每个通道的重要程度,然后用这个重要程度去给每个特征赋予一个权重值,从而让神经网络重点关注某些特征通道。提升对当前任务有用的特征图的通道,并抑制对当前任务用处不大的特征通道

在这里插入图片描述

 

       最大的改变在于网络的最后一层。

        在V2中,全局平均池化层之前,是一个1*1卷积,将通道数从320扩展到1280,因此我们就能得到更高维度的特征,供分类器层使用。

       在V3中,将平均池化前的操作移除,在平均池化后直接使用1*1卷积获得特征图,减少了参数,加快了速度。

        还有一个改变在于激活函数 ,之前V1和V2都是用ReLU6作为激活函数(限制输出值,但可能在低维是损失特征),但是在V3中,作者使用了hard swish。原本的swish虽然可以提升精度,但是却太耗费时间。

FPN多尺度特征融合 

        经过BackBone获取特征后,会通过FPN结构进行多尺度的特征融合。

        在目标检测中,高层特征包含了丰富的语义信息,但由于分辨率低,位置信息不准确;底层特征虽然语义信息不丰富,但分辨率高,包含的位置信息准确。

DB Face详解_第3张图片

         在DB Face中采用UpSample+Conv+BatchNormal+Add进行多尺度特征融合。在经过了多尺度特征融合之后的特征图会经过SSH操作得到三个输出

DB Face详解_第4张图片

 SSH

        为了增加特征图有效的感受野,使特征图的表征能力更强在这里插入图片描述

        

你可能感兴趣的:(深度学习-初级,人工智能,深度学习)