论文笔记:Objects as Points(CenterNet)

论文笔记:CenterNet

简介

以往的检测方法很多都是找到一大堆潜在目标的位置并且逐一分类,效率很低,本文提出的方法是通过关键点估计来找到目标中心点并且回归出目标的所有属性(包括offset、检测框尺寸、类别等等)。通过一个全卷积神经网络,生成一个heatmap,找到这个heatmap的峰值就是物体的中心。这个方法同时也可用于人体关键点检测和单目深度估计。

方法

简单来说,就是通过一个全卷积网络,输出一个尺寸为原来1/4的heatmap,通过在heatmap上找出峰值位置来检测物体,然后对于每一个位置都回归出一个类别、位置偏差和尺寸,也就是说网络输出的尺寸是(w/4,w/4,c)+(w/4,w/4,2) +(w/4,w/4,2)(第一项表示每个类别预测一个heatmap出来,后两项的位置偏差和尺寸预测所有类别共享)。

Preliminary

论文笔记:Objects as Points(CenterNet)_第1张图片
网络输出一个heatmap用于预测目标中心点,使用高斯核将gt投影到heatmap上,进行训练。

loss

分类逻辑回归损失:
论文笔记:Objects as Points(CenterNet)_第2张图片
offset损失:
论文笔记:Objects as Points(CenterNet)_第3张图片
size预测损失:
论文笔记:Objects as Points(CenterNet)_第4张图片

在这里插入图片描述

网络结构

论文笔记:Objects as Points(CenterNet)_第5张图片

文中选择了三个不一样的网络结构,Hourglass Network、RESNet,DLA,并且做了一定的改动,如图所示。方框里的数字是相对于输入尺寸的缩放比例

效果

这个思路可以同时用于2D检测、人体关键点检测、单目深度估计

你可能感兴趣的:(论文笔记,目标检测)