详喷TLD

     之所以从TLD这个算法开始扒,是因为它够经典,涉及的范围够广,引用的参考文献也够经典,哈哈,原作者已经在筹备开公司了。我刚开始学习就是从它入手,逐渐的扩展,写下来,给初学的人一点点参考。

    TLD的代码是开源的,你可以从摄像头或者测试视频中选择任意的物体进行跟踪,所以tld和其他用分类器做的算法相比,是可以具体到某物,拿hog+svm,和ism来说吧,这两个算法都是具体到某一类别,比如行人啊,车辆啊,这主要是基于分类器做的检测在训练的时候要选择训练样本和样本标记,也就是属于有监督学习的过程。当然,你可以在线学习也就是半监督的形式,但是这对分类器的实时性要求很高,在《Incremental Learning for Robust Visual Tracking》中就y用的是在线学习,但是我仿真过,效率确实还不是满足不了实时场合的应用。而TLd也用到了在线学习,那么它之所以效率高些是因为它用的是random forest classifer,这是一个很好的分类器,也是近年来比较热门的,我所认识的cv领域的外国专家有限,但是他们对这个rf都用的很多。tld还有一个创新的地方就是P-N learning,那么再来就是他边检测边跟踪的了。也许你还不清楚,没关系,一步一步来看,先来一下总体的:看下面这个图:


  

详喷TLD_第1张图片这个图示TLD算法的框架图,解释一下Tracking-Learning-Detection。它的tracker用的lk法,这是一个frame to frame的跟踪方法,用它来对目标的运动进行估计,当然lk跟踪的精度是不高的,会跟踪失败,当跟丢的时候就要用到我们的rf detector,detector用于对每一帧的出现的目标进行定位记录相应的位置信息和表面信息,称之为学习,当tracker跟丢时,凭着detector的过去的学习,对目标进行重新定位。learning是将tracker和detector联系起来的纽带,这个learning方法是P-Nlearning。

你可能感兴趣的:(详喷TLD)