Bounding Box Regression with Uncertainty for Accurate Object Detection 论文

Bounding Box Regression with Uncertainty for Accurate Object Detection 论文_第1张图片

这篇论文发表在2019CVPR上,旨在解决人工标注有遮挡,不明确信息(如上图所示)带来的目标检测算法性能降低的问题。

论文的主要新颖点:

1.使用KL散度替换smooth L1 loss

2.对soft-NMS的后续处理中采用var voting 的方式,来预测候选框的位置      

为什么这样做,论文中指出使用KL散度

(1)可以成功地捕获数据集中的歧义。包围盒回归器在包围盒不明确时损失较小。

(2)学习的方差在后处理过程中是有用的。我们提出了VAR投票,在NMS过程中,使用邻居的位置加权预测的方差来投票候选盒的位置。

(3)学习的概率分布是可解释的。由于它反映了边界框预测的不确定性水平,因此它可能对自动驾驶汽车和机器人等下游应用程序有所帮助

在KL损失的情况下,模型可以在训练过程中自适应地调整每个对象边界的方差,从而帮助学习更多的区分性特征。

网络预测的概率分布服从高斯分布P_{\theta }(x)=1/\sqrt{2\pi \sigma ^{2}}e^{-(x-x_{e})^{2}/2\sigma ^{2}},其中x是真实边界框的位置,x_{e}为预测边界框位置,\sigma用来衡量预测的不确定性,当\sigma越接近于0,网络越确定预测边界框的准确性。真实边界框采用狄拉克增量函数,P_{d}(x)=\delta (x-x_{g})即当xg等于x时,函数值为1,其它点函数值为0。

 Bounding Box Regression with Uncertainty for Accurate Object Detection 论文_第2张图片

损失函数使用P_{D}(x)相对于P_{\theta }(x)的KL散度(相对熵),KL散度主要用于度量两个向量的距离。

x_{e}预测不准时,方差便会增大,降低Loss。个人理解这也是为什么该方法行的通的原因,对于预测不准确的框给予较大的方差,不单纯的考虑位置信息。

var voting

Bounding Box Regression with Uncertainty for Accurate Object Detection 论文_第3张图片

在soft-nms后进行了var voting,通过KL损失学习到的相邻边界框的方差来对选择的框产生新的位置。我们为距离较近、不确定性较低的盒子赋予较高的权重(\sigma _{t}

Bounding Box Regression with Uncertainty for Accurate Object Detection 论文_第4张图片

 

结论:

边框回归不准确,是检测领域一直以来的问题。分类置信度并不总是与本地化置信度密切相关。除了学习分类置信度之外,学习定位置信度对于更准确的目标定位是非常重要的。

 

你可能感兴趣的:(论文,人工智能,目标检测)