目标追踪

SiamRPN
基于SiamFC+RPN模块让tracker回归省略了多尺度测量提高计算速度。
DaSiamRPN
主要是修改数据增强和算法扩展Long-term。
SiamRPN++
修改了基础backbone,并且说明ResNet不具备严格的平移不变性链接地址:https://stats.stackexchange.com/questions/246512/convolutional-layers-to-pad-or-not-to-pad。另外在该模型添加了空洞卷积增大感受野。

下面分别来介绍与之前的区别:

Cross Correlation:如上图(a),用于SiamFC,模版支特征在搜索区域上滑窗的方式获取不同位置的响应。
Up-Channel Cross Correlation:如上图(b),用于SiamRPN,于Cross Correlation不同的是在做correlation前多了两个卷积层,一个提升维度(通道数),另一个保持不变。之后通过卷积的方式,得到最终的输出。通过控制升维的卷积来实现最终输出特征图的通道数。
Depthwise Cross Correlation:如上图©,和UpChannel一样,在做correlation操作以前,模版和搜索分支会分别过一个卷积,但不需要提升维度,这里只是为了提供一个非Siamese的特征(SiamRPN中与SiamFC不同,比如回归分支,是非对称的,因为输出不是一个响应值;需要模版分支和搜索分支关注不同的内容)。在这之后,通过类似depthwise卷积的方法,逐通道计算correlation结果,这样的好处是可以得到一个通道数非1的输出,可以在后面添加一个普通的 1\times1 卷积就可以得到分类和回归的结果。
这里的改进主要源自于upchannel的方法中,升维卷积参数量极大, 256\times(256*2k)\times3\times3 , 分类分支参数就有接近6M的参数,回归分支12M。其次升维造成了两支参数量的极度不平衡,模版分支是搜索支参数量的 2k/4k 倍,也造成整体难以优化,训练困难。
改为Depthwise版本以后,参数量能够急剧下降;同时整体训练也更为稳定,整体性能也得到了加强。

你可能感兴趣的:(计算机视觉)