VOT2015跟踪算法总结(过完国庆假期将完善)

        由于工作需要,最近半个月一直在研究跟踪算法。在做算法调研,希望找到一个优秀的算法,在一定的精确范围内,速度尽量很快。

      半路出家,完全的小白。连VS2010和opencv249的配置也不太会,经常跑通一个一个源码花了半天甚至一天。对于我这种初学者,在这里。首先要感谢的VOT跟踪器的作者,特别那种无私在github或者个人网站无私奉献出自己的源代码好人,点赞!他们的开源,为我们减轻了很多算法实现工作量。此时我们只需要站在巨人的肩膀上看的更高!对原算法进行改进,包括效率,精度,及实现策略。

     找到了很多算法,有C++的,有matlab的。一般VS的项目需要耐心的配置和调试。由于开发环境、系统、依赖库,opencv库的版本等综合原因,基本上down下来跑不通。而matlab一般容易跑通。目前已经调通了很多算法,算有一些经验,至少现在不会看到一大堆error急躁起来。会心平气和的去看错误,去检查配置,耐心一点,基本可以排除很多配置错误。

    为了找到一个高效精确的跟踪器。首先将目光投向权威性较高VOT2015竞赛。这些算法很多是state-of-the-art 跟踪器,特别是rank比较前的,因此很值得研究。第一名的算法是MDNet算法,是与神经网络深度学习结合起来的。早有耳闻,图像与机器学习/深度学习结合是大势所趋。这一点从这几年的其他顶级的图像会议同样可以看出,多数文章是CNN,RNN应用图像领域,得到质的突破。

     测评VOT2015发现down下来的代码也test的结果不一定与VOT的结果一致。有些速度快的不一定有那么快,速度慢也没有VOT呈现的那么慢。也有可能是作者开源的代码并不是提交的代码(猜测)。其实我想说,我们可以将VOT作为一个参考,但千万不要迷信排名。特别一般算法的性能与场景有很多的关联性,一种算法在某种场景表现十分有益,到另一种场景下不一定有那么好的性能。很少有那么一种算法,能hold住全场。因此,我的测试标准不是看排名。而是测试自己的视频序列,工作需要的真实应用场景。这样能找出最好的算法。

     下面先传一张VOT2015测评结果排名图。标记表示已经测试过的,另外还测试TLD、DLSSVM、LCT等(共12种跟踪算法)。对算法的总结留到国庆后,有很多需要提炼和完善。

                                                           VOT2015跟踪算法总结(过完国庆假期将完善)_第1张图片



 参考文献:

1. Kristan M, Matas J, Leonardis A, et al. The visual object tracking vot2015 challenge results[C]//Proceedings of the IEEE International Conference on Computer Vision Workshops. 2015: 1-23.


你可能感兴趣的:(视频跟踪)