多级特征融合检测小目标的一些个人理解

Feature-Fused SSD:Fast Detection for Small Objections
这篇文章是在SSD的基础上对于小目标的检测做了一些改进,取得了很好的效果。
小目标检测仍然是当下需要解决的问题。在发明SSD算法时,Wei liu 大神肯定是深知SSD的优点和缺点,故在SSD之后又以而作作者与Cheng Yang Fu联合发表了DSSD算法。在SSD卷积层之后,添加了辅助卷积层以及相对应的不对称的反卷积层。同时,将基础网络由VGG_16换成了Resnet101。显然,这样增强了特征的提取,但同时增加了计算量,不可避免的导致了速度的变慢。
由Guimei Cao等人提出的Feature-Fused SSD算法同样融合了上下文信息,但是它的基础网络仍然是VGG_16,与DSSD不同之处是利用融合高层的语义信息去感知低层的语义信息。
论文文章作者对各种高层的提取信息的能力进行了分别实验。

多级特征融合检测小目标的一些个人理解_第1张图片
从图中不难发现,层次越高,卷积层感知的范围会更深,但是到了Fc6层,不难发现,带来的背景噪音也会不可避免的变多。
随后便是对选取合适的层组合进行分别实验。作者首先对组合层的结构进行了说明。
作者设计了两种特征融合的模型。第一种是Concatenation Module
多级特征融合检测小目标的一些个人理解_第2张图片
为了使得Conv5_3能够与Conv_4有相同的尺寸,需要用双线性采样进行初始化,然后分别用两个3 * 3的卷积更好的学习所需融合的特征,随后归一化层分别遵循20,10的比例(个人猜测这个归一化层是为了能够使模型收敛,因为提取到的上下文信息可能是分散的),再分别经过激活函数后沿着通道相连。初次融合后,用1 * 1卷积生成最终的特征融合图,用于降维以及信息的更好的融合。
第二种是Element-Sum Module多级特征融合检测小目标的一些个人理解_第3张图片
与上面的Concatenation Module在不同层融合前的操作相同,不同之处在于采用了Resnet101中的利用反卷积后的信息与普通卷积后的元素信息进行想加。不难发现,Concatenation Module能做到的是可以减少背景噪声信息的干扰,Element-Sum Module所能做到的是增加上下文信息的感知。
实验结果
多级特征融合检测小目标的一些个人理解_第4张图片
不难发现,采用Conv4_3与Conv5_3的融合采用第一种方法的精度最高。
多级特征融合检测小目标的一些个人理解_第5张图片
kernel的选择在第一种方法选择512个,第二种方法选择384个。
接下来作者是利用PASCAL VOC2007进行测试的。
多级特征融合检测小目标的一些个人理解_第6张图片
显然,特征融合的两种方法的整体mAP都是较高的,能够达到很高的精度。多级特征融合检测小目标的一些个人理解_第7张图片
但是在速度方面,显然特征融合的方案更佳。
参考博客:
https://blog.csdn.net/zj15939317693/article/details/80599596
https://blog.csdn.net/zhangjunhit/article/details/78031452
https://blog.csdn.net/u010725283/article/details/79115477
这是本人第一次写算法理解,不当之处,谢谢指正。

你可能感兴趣的:(目标检测)