tld算法总结

Open TLD 总结

现有的跟踪方法分为两类,一类利用滤波、光流、像素变化等进行直接对目标进行跟踪,另一类是基于检测的方法,在视频流中做滑窗,不断的检测图像中有没有跟踪目标。第一类方法,在长期跟踪的时候,由于跟踪目标会发生形状、尺度、亮度等变化,从而导致目标丢失。第二种方法,在跟踪某个目标之前,我们要对分类器提前进行训练,训练的数据集必须包含多尺度、多姿态和各种光照情况。

TLD(Tracking - Learning - Detection)算法最早是由捷克大学的Zdenek 提出来的跟踪算法,他和传统的跟踪算法最大的区别在于,它将跟踪和检测融合在一起,从而解决了纯跟踪算法在目标发生尺度,形状变化时,能够通过检测将找回目标并重新跟踪。与此同时,TLD的检测算法是在线学习,不需要提前训练,在跟踪的时候不断更新自己的训练数据,从而确保检测的稳定性。在跟踪模块和检测模块协调工作下,跟踪的稳定性和准确度得到大大的提升。与其说TLD是一种跟踪算法,不如说他是一个跟踪系统,在跟踪模块出现较大偏差的时候,检测模块对偏差进行修正,构成一个闭环系统,让系统达到稳定。

tld算法总结_第1张图片

TLD的程序框架如上图所示。跟踪模块是利用L-K光流法在通过图片光流的变化确定跟踪目标,光流法使用的前提是运动速度有限而且跟踪目标能够看见。检测模块的作用是在跟踪目标丢失时根据先前在线学习的模型,对当前图片进行滑动搜索,从而找到丢失的目标。在找到目标之后,它会将目标位置返回给跟踪模块,重新进行跟踪。学习模块负责训练检测模块的分类器。它将目标所在的图片标记为正样本,其他位置的图片标记为负样本,实时更新训练数据,提高检测精度。同时,学习模块会根据跟踪模块的结果对检测模块的结果进行分析,从而修正检测模块的错误,避免以后出现同样的错误。


你可能感兴趣的:(计算机视觉,算法学习)