CenterNet目标检测【详解】

文章目录

      • 1、Backbone
      • 2、Heatmap
        • 2.1 Heatmap Loss
        • 2.2 WH Loss
        • 2.3 offse Loss
        • 2.4 Total Loss 和 decode

1、Backbone

Hourglass:主要用于关键点检测,缺点是权重太多
Resnet:速度快,但效果不好
DLA:折中的方案

2、Heatmap

网络在预测heatmap中心点的时候,不是只在一个点为1,其他点为0;而是一个高斯分布,类似于山峰的形状,

首先介绍一下CornerNet,红框是GroundTruth,绿框是预测的,则预测框和GT有3种情形,分别计算IOU,求出半径 r ,然后选出3种 r 的最小值。

(1)GT在预测框之内
CenterNet目标检测【详解】_第1张图片
(2)GT在预测框之外
CenterNet目标检测【详解】_第2张图片(3)GT和预测框重叠
CenterNet目标检测【详解】_第3张图片

2.1 Heatmap Loss

这是原始的Focal Loss

CenterNet目标检测【详解】_第4张图片

这是改进后的Focal Loss,即GT越接近于1, ( 1 − Y x y c ) β (1-Y_{xyc})^\beta (1Yxyc)β越小,相应的非正样本的Loss就越小, α \alpha α β \beta β是超参数,

CenterNet目标检测【详解】_第5张图片

2.2 WH Loss

采用的是L1 Loss,

CenterNet目标检测【详解】_第6张图片

2.3 offse Loss

比如原图是512x512,进行4倍下采样后变成128x128,然后再乘4倍后一定会有精度的损失,所以需要计算offset的回归, x k n \frac{x_k}{n} nxk是没有损失精度的float类型, [ x k n ] [\frac{x_k}{n}] [nxk]是int类型,是损失精度的,
CenterNet目标检测【详解】_第7张图片

2.4 Total Loss 和 decode

Loss包括Heatmap Loss,宽高的Loss,为了避免检测大物体的影响,需要在前面乘以 λ s i z e \lambda_{size} λsize λ s i z e \lambda_{size} λsize设置为0.1,以及offset Loss;

下面2行是解码过程;

CenterNet目标检测【详解】_第8张图片

你可能感兴趣的:(图像算法,深度学习,目标检测,深度学习)