深度学习设计

损失函数设计:

1、目标检测领域:不提倡使用预测框坐标与GT坐标的差值进行损失函数统计,因为坐标差值会受坐标尺寸大小影响,坐标

尺寸大的时候,差值相对大,坐标尺寸小,差值相对小。

改进:使用IOU,IOU不受坐标尺寸因素的影响。

(两种坐标表示方法:(左上角,右下角)(中心点,长,宽))

 

2、bounding box 表示方式:

绝对坐标

归一化坐标

由于在深度学习网络中,对于输入的图像一般需要做resize操作,所以resize后,bounding box的绝对坐标不起作用了,

所以深度学习网络中一般使用归一化坐标表示bounding box的坐标。

3、bounding box的类型

轴对齐bb,带方向bb,圆形bb

深度学习设计_第1张图片

 

4、目标位置预测方式

由于深度学习网络直接预测目标的中心点(x,y),宽w,高h比较困难,一般都不会直接预测x,y,w,h。通过间接预测来达到目的

如yolo系列的目标位置预测方式:

通过预测tx,ty,tw,th,然后通过公式转换得到最终预测目标位置bx,by,bw,bh

图中pw,ph为gt的宽和高

深度学习设计_第2张图片

5、anchor的限制:

anchor的机制其实有点像暴力机制,经验丰富的调参选手能够设置很好的anchor尺寸覆盖其所训练集的目标大小,其中yolo

系列使用了k-mean来对训练集的gt进行聚类来设定anchor的尺寸。虽然经验设定的anchor在实际应该中效果不错,但是还是存在

不足的。1、是经验上的限制吧,打比赛可以使用论文默认的是anchor尺寸,因为比赛数据集无非就那几个比较有名的,但是如果真正应用到实际项目中,论文默认的anchor可能就失效了,调整anchor对于经验不足的也是麻烦事;2、模型复用性低的问题,因为anchor是针对具体数据集的物体大小来设置的,如果切换目标大小变化比较大的数据集,又得重新设置anchor,重新训练模型了。

so,2019年anchor free研究风暴起来了。

 

你可能感兴趣的:(DeepLearning)