Anchor-free目标检测算法系列6:CSP(中心点+尺度预测)Center and Scale Prediction: A Box-free Approach for Object Detect

论文与CenterNet:Object as points 文章的思想很相似。以行人检测为例将目标检测简化为一个直接的全卷积式的中心点和尺度预测任务,CSP (Center and Scale Prediction) 检测器结构简单。首先将一张图像输入全卷积网络,基于网络提取的特征图预测两个映射图,一个以热图的方式呈现目标的中心点位置,一个负责预测目标的尺度。在此基础上,便可以将两者映射到原图上并解译成目标检测框:中心点热图的位置对应检测框的中心位置,预测的尺度大小对应检测框的大小,而中心点热图上的置信度则对应检测框的得分。该算法在行人检测和面部检测数据集上做了实验,准确率有竞争力。

Anchor-free目标检测算法系列6:CSP(中心点+尺度预测)Center and Scale Prediction: A Box-free Approach for Object Detect_第1张图片

                                              图25 CSP整体架构示意图图

网络包括两个部分:特征提取和检测。前者把不同分辨率的特征图连在一起,后者是卷积层和两个预测层,分别对应中心位置和尺度大小。基于上述特征图,检测头负责将特征图解译成检测结果。在检测头模块中,首先接上一个 3x3 卷积层将输入特征图的维度压缩到 256,然后接上两个并联的 1x1 卷积层产生目标中心点热图和目标尺度预测图,这样相较于 R-CNN 及 SSD 等工作而言极大地简化了检测头模块。实验表明中心点检测和尺度预测已经足以胜任行人检测任务。但采用降采样的特征图会影响目标定位性能,为了弥补这一缺陷,在中心点以及尺度预测之外,还可以额外添加一个偏移预测分支,用以进一步预测中心点到真实目标中心的偏移。与CenterNet的不同之处为,在最后检测头处理中,CenterNet将提取到的特征图分别送入三个子网络,拥有单独的3*3卷积和1*1卷积块,没有像本文一样共享了同个3*3卷积层。

Anchor-free目标检测算法系列6:CSP(中心点+尺度预测)Center and Scale Prediction: A Box-free Approach for Object Detect_第2张图片

                                                                             图26 CSP网络结构图

下图给出了中心点和尺度的生成示例:对于中心点,当目标中心落在哪个位置,则在该位置赋值 1 (即正样本),其它位置赋值 0 (即负样本)。对于尺度图,当目标中心落在哪个位置,则在该位置赋值尺度的 log 值(CenterNert中没有进行log操作),其它位置赋值 0。取 log 函数是为了将分布范围较大的原始尺度压缩在一定的范围内,并且误差是尺度无关的,以有利于检测器的训练。考虑到单一中心点的不确定性,在图 (c) 中定义了一个高斯掩码,用以降低中心点周围负样本的权重。

Anchor-free目标检测算法系列6:CSP(中心点+尺度预测)Center and Scale Prediction: A Box-free Approach for Object Detect_第3张图片

                                                                                 图27 CSP检测图

        CSP 的小目标检测能力较好,得益于大分辨率的特征图。而对于遮挡,传统的基于密集滑窗或者基于 Faster R-CNN、采用感兴趣区域池化 (ROI Pooling) 的检测器,本质上都是对目标区域的一个整体判断的分类器,因此目标区域的遮挡和背景等信息是包含在其整体判断里的。而本文提出的 CSP 对目标在哪里和有多大进行了解离,在热图上只检测中心点,尺度大小是额外预测的,因此受遮挡的影响相对较小。但是对于同类别的遮挡物体,如果二者的中心点重合,CSP算法也是无能为力的。

你可能感兴趣的:(学习笔记,目标检测)