文章:Real-time compressIve tracking
K Zhang, L Zhang, MH Yang - Computer Vision–ECCV 2012, 2012
文章开头指出:用于跟踪的自适应表观模型,是需要很多的训练数据的。但是在在线的算法中,没有足够的数据。就此作者提出一个有效的基于多尺度特征空间的特征提取的方法来构造表观模型。通过尺度变换的方法可以扩充样本。但是很明显会增加计算的复杂度。于是作者再对扩充的样本进行压缩。使得计算复杂度降低。
在在线的tracking当中,产生式模型(generative model)往往存在这样的问题:1、数据少,不利于模型的更新;2、所有的操作都是建立在目标位置没有突变的假设下面的,于是会有漂移的出现;3、并没有充分的利用背景信息。判别式模型(discriminative model)将tracking任务看成是二分类问题,就是要从背景中找出目标。主要的方法有:光流法,在线boosting(???还有什么勒)。主要存在的问题是,只有一个正样本,而通过正样本扩充的方法可能会引起分类器的迷惑。
本文所采用的方式是:将正负样本通过尺度变换,对样本量进行扩充;然后将这个多尺度的样本空间的样本通过稀疏矩阵投影到低维空间中。这个时候既保证了样本的准确度,有效的降低了计算量。
具体的细节:
1、将t帧中得到的目标的位置作为正样本,进行样本的扩充;同时扩充背景作为负样本;
通过 在距这个目标中心很小的距离(也是中心点)范围内,扩充正样本;通过
以同样的原理进行负样本的扩充。
2、将所得到的正负样本集分别通过一组矩形滤波器集合进行进行尺度变换,得到大量的训练样本集;
这个矩形滤波器可以对样本进行多尺度的尺度变换。得到一个w*h的patch块集合。(但是我不能理解为什么文章中3.1说的)
3、将得到的大量的正负样本集通过一个稀疏的随机矩阵,映射到低维空间中。将所得到的大量的训练样本集用低维空间中的向量表示(实验中大概50维)。
这个稀疏的随机矩阵是通过以下的方式得到的:
可见s的取值越大,得到的矩阵就越稀疏。通过这个矩阵将高维的数据映射到低维的特征空间中。
4、将得到的低维的向量通过积分图像的方式求得它的haar-like特征,得到一个特征池;
5、通过得到的特征,使用Adaboost的方法进行特征选择,来训练一个朴素贝叶斯模型,进行判断,得到目标的位置作为跟踪的结果。在最可能的目标位置。
构造的分类器的模型是这样的:
通过上面的特征向量就可以训练。训练好以后,在一个最可能出现的范围内:
,找到响应值最大的位置。
优点:
1、其中的特征相当于取自一组不同尺度空间的矩形块的集合。使得训练的表观模型具有更好的鲁棒性。
2、先扩充样本,再映射到低维空间中。不仅有足够的准确的信息,同时也提高了计算的速度,所以效果非常的好。
缺点:暂时没发现