The Way They Move: Tracking Muitiple Targets with Similar Appearance文章思想及其代码分析

1.      思想

本文解决关于相似外观物体多目标跟踪的问题。本文也是基于先检测再跟踪。其主要思想是将目标的运动模型建模,然后根据运动模型进行预测。与其他方法不同之处在于不必设置大量参数,而且可以恢复丢失的数据。

本文的研究是对另外几篇研究的综合。包括:

1)        将[1]中的公式的约束条件改为

2)        相似性的求解是本文的提出的动力学模型的关键点。本文通过构造hankel矩阵[2]来并估计其秩,来衡量两个的tracklet的相似性。

3)        通过以上更改之后需要使用GLA进行求解[3]。本文使用的是一个该求解方法的toolbox。通过GLA分配之后,哪些跟踪块应该合并,就被确定。确定了这个之后,就可以实际合并。

注意,文章中合并多个跟踪块并不是一次性实现的。不是把所有的跟踪块拿出来,计算相似性,分配,就完事了。实际上,这样的效率肯定不行。作者使用了窗口的方法。本文采用了三个阶段的策略。假设窗口大小为60。第一阶段:先将1:60的目标合并,61:120的目标合并,依次类推。第二阶段:将30:90的目标合并,91:151的目标合并,依次类推。最后一阶段,先将窗口翻倍,这里为120。将1:120目标合并,121:240目标合并,依次类推。这个阶段的窗口较大,所以,时间也比较长。

本文的贡献在于:转化为GLA求解,引入hankel,在hankel中使用二值标记来标识数据的缺失(用于恢复丢失数据),迭代的方法来估计rank

2.      代码框架

The Way They Move: Tracking Muitiple Targets with Similar Appearance文章思想及其代码分析_第1张图片

The Way They Move: Tracking Muitiple Targets with Similar Appearance文章思想及其代码分析_第2张图片

本文代码应该是从更大的项目中提取出来的,包含了很多无用代码,注释,以及空白行。代码命名规律为:itl表示跟踪块tracklet相关的函数,smot表示hankel相关的函数。idl2itl.m将检测数据转化为跟踪块。代码核心在于associate_itl。其中compute_itl_simiarity_matrix.m用于计算相似性。其中包含构造hankel,ihtls算法等。GLA使用的是一个toolbox,基本没有做更改。其中fast_hstln_mo的代码,解决hankel rank估计。具体的符号与[2]一致。建议参照 [2],说得非常清楚,甚至有例子。

如果想用一个新的数据集来测试算法,需要生成对应的itl文件。itl文件格式为, 总帧数。下面每个序列表示一个目标,格式为目标编号,起始帧号,结束帧号,x坐标,y坐标,宽度,高度,Omega。




[1] Pirsiavash H, Ramanan D, Fowlkes C C. Globally-optimal greedy algorithms for tracking a variable number of objects, Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on. IEEE, 2011: 1201-1208.

[2]H. Park, L. Zhang, and J. Rosen. Low rank approximation of a hankel matrix by structured total least norm. BIT Numerical Mathematics, 39(4):757–779, 1999. 2, 4

[3]S. Gold, A. Rangarajan, et al. Softmax to softassign: Neural network algorithms for combinatorial optimization. J. of Artificial Neural Nets., 2(4):381–399, 1995. 3

你可能感兴趣的:(The Way They Move: Tracking Muitiple Targets with Similar Appearance文章思想及其代码分析)