denghe1122

VOT 2017挑战赛——目标追踪相关分享

转载于微信公众号：新智元

视觉跟踪领域国际顶级赛事 Visual-Object-Tracking Challenge (VOT) 2017年结果出炉，结合传统滤波及深度学习的方案取得最佳成绩。本文是第二名北京邮电大学代表团队的技术分享。他们基于滤波的框架，抛弃传统特征，只使用CNN特征，减少了特征冗余，缓解了模型过拟合，使追踪器在速度和精度上都有不小的提高。代码分享链接：https://github.com/he010103/CFWCR.git

随着深度学习在计算机视觉方面大放异彩，近几年物体追踪也得到了飞速的发展。物体追踪解决的问题是在一段时间内对于同一个物体在复杂的背景下（如遮挡，光照，物体旋转等），进行持续高速的跟踪。因此，物体追踪是监控，安防，自动驾驶，无人机，智能家居等应用中必须解决的关键课题。

作为视觉跟踪领域的最高峰，Visual-Object-Tracking Challenge (VOT) 是国际目标跟踪领域最权威的测评平台，由伯明翰大学、卢布尔雅那大学、布拉格捷克技术大学、奥地利科技学院联合创办，旨在评测在复杂场景下单目标短时跟踪的算法性能。由于每年的评测序列都会更新，且标注的精确度一年一年提高，VOT竞赛也被视为视觉跟踪领域最难的竞赛，远远超过了其他数据集。因此，每年最好的追踪算法都会在上面一展拳脚，在激烈的比拼中擦出灵感的火花。

今年的比赛 VOT 2017，作为 ICCV 2017的一个workshop，吸引了来自全世界的38个队伍参加（CMU，中科院，法国科学院，香港理工，华中科技大学，国防科大，美国海军研究院，牛津大学，中国科技大学，浙江大学等），提交了38个新的算法参加了比赛，加上组委会自行提交的13个算法，总共对比分析了51个跟踪器在VOT2017 数据集上的表现。

在公开的38个队伍中，大连理工大学的卢湖川教授队伍夺得第一名。由北京邮电大学董远教授指导，北京飞搜科技&北京邮电大学代表队何智群、樊应若、庄骏飞、白洪亮提交的结果（CFWCR）获得VOT 2017竞赛公开的60个评测序列中第二名。

VOT 竞赛，检验当前单目标追踪最高标准

VOT 2017与VOT 2016相比，VOT 2016中某些序列已经被多数tracker准确跟踪，所以在VOT 2017中，将VOT 2016的10个评测效果差图像序列替换如图1，并且保证总体的序列属性分布不变。与此同时，VOT2017相对于VOT2016对所有序列的还对所有序列的ground truth进行了重新标定，精确到像素级别，然后重新拟合矩形框。

VOT2017使用EAO（Expected Average Overlap）、Accuracy、Robustness三个主要指标对跟踪结果进行评估，

(1)、平均重叠期望（EAO）是对每个跟踪器在一个短时图像序列上的非重置重叠的期望值，是VOT评估跟踪算法精度的最重要指标。
(2)、准确率（Accuracy）是指跟踪器在单个测试序列下的平均重叠率（两矩形框的相交部分面积除以两矩形框的相并部分的面积）。
(3)、鲁棒性（Robustness）是指单个测试序列下的跟踪器失败次数，当重叠率为0时即可判定为失败。

今年的VOT结果如下：

VOT 2017结果显示，目前跟踪算法的主流方法主要分为三种，一是传统的相关滤波方法，二是基于卷积神经网络方法，三是深度卷积特征和传统的协同滤波相结合的方法。

其中，使用深度卷积特征和协同滤波结合的方法效果最好。例如今年VOT第一名，大连理工大学卢老师的LSART，他们提出的追踪器以一种新的方式结合了CNN和相关滤波，通过设计算法让CNN专注于特定区域的回归，相关滤波专注于全局的回归，在最后对回归的结果进行组合，以互补的方式得到物体的精确定位。

今年VOT的51个tracker中，深度特征和相关滤波结合的方法共9种，采用如VGG网络提取特征再输入到相关滤波框架内，以非端到端线上更新滤波参数，达到准确追踪的效果。这9种深度特征和相关滤波结合的方法在VOT2017种表现均较为出色，包揽了前四名。

VOT 2017视觉跟踪第二名技术：单卷积特征的相关滤波解决方案

北京飞搜科技&北京邮电大学代表队提交的结果（CFWCR）获得VOT 2017竞赛公开的60个评测序列中第二名。

我们的方法基于业界流行的相关滤波的框架。我们使用了单CNN特征的多尺度追踪方案。现有很多追踪器融合了CNN特征和传统的机器学习特征，如hog特征，CN颜色特征等。在我们的实验中，我们发现CNN的浅层特征具有物体轮廓的信息，高层的深度特征具有物体的语义信息，将CNN的浅层和高层特征进行融合，能使追踪器具有很好的性能。

CNN的特征和传统特征的融合会使得特征的冗余太多，容易导致参数更新的时候模型过拟合，解决过拟合的一种方法是用PCA对特征进行降维。但是，过于复杂的特征组合方式不太利于超参数的精调，我们摒弃了传统的特征，只使用了CNN的特征。这一做法，减少了我们的特征冗余，模型过拟合的情况得到很大的缓解，使得我们的追踪器无论是在速度上还是精度上都有了不小的提高。

使用相关滤波框架的一大困难是具有很多的超参数，这和目前主流的端到端深度学习训练框架有很大的不同。我们发现用PCA对特征进行压缩，能使得追踪器在追踪速度上有很大的提高，但是性能会略有下降。因此，我们在评测上没有使用PCA，而在实用的追踪系统中用PCA能更好地均衡速度和精度。

此外，我们发现，在评测中，增加候选尺度的数量能使我们的追踪器更好地适应物体在时间序列中形状的变化。最后，我们对CNN的轮廓信息和语义信息进行了加权融合，以最优的方法对特征进行组合。

下面是我们的追踪器在不同的序列长度下的表现曲线。可以看到，我们的算法在短视频序列的表现明显优于其他主流的算法。

视觉跟踪未来展望：充分利用CNN

连续两年的VOT比赛中，基于相关滤波和CNN结合的追踪器表现突出，在性能指标上遥遥领先于其他算法。然而，非端到端的训练框架拥有很多的超参数，线上更新的方式也使得在实际算法部署的过程中，目前性能最优的一些追踪器难以满足实时性的要求。

视觉追踪方向和物体检测、物体分割方向不同的一点，在于CNN并没有完全发挥它的强大作用。未来的视觉追踪方向应该会更加关注实时性和训练的便捷性，端到端训练的追踪器会更多涌现，让CNN能够完全在视觉追踪领域发挥功效。我们也将继续在视觉跟踪领域深入研究，希望能给学术界和工业界做一些小小的贡献！

代码分享链接：https://github.com/he010103/CFWCR.git

参考资料
[1]http://www.votchallenge.net
[2]http://openaccess.thecvf.com/content_ICCV_2017_workshops/papers/w28/Kristan_The_Visual_Object_ICCV_2017_paper.pdf
[3]http://openaccess.thecvf.com/content_ICCV_2017_workshops/papers/w28/He_Correlation_Filters_With_ICCV_2017_paper.pdf

目标检测与目标跟踪算法技术汇总易烊千玺铁粉深度学习目标跟踪目标检测算法
现如今chatgpt的爆火，我也使用了一段时间，问了许多关于人工智能技术的问题，基本是它能够回答了大部分的原理的，至于其人工智能涉及到的算法以及网络，考虑到也没有图，可能在给出这类回答上，是不太容易理解的。本章旨在介绍当前热门的目标检测、目标跟踪算法和方法，我选择使用chatgpt给出答案辅助我完成这篇文章文章后面会给出算法的github链接目标检测与目标跟踪算法技术汇总1传统方法2目标检测进展2
激光点云有关目标检测与目标跟踪的消息定义 felynman 目标检测目标跟踪
1、jsk_recognition_msgs/BoundingBoxArray.msg安装jsk_recognition_msgs：sudoapt-getinstallros-melodic-jsk-recognition-msgs&sudoapt-getinstallros-melodic-jsk-rviz-plugins安装jsk_rviz_plugins可以在rviz上可视化看到聚类框消息定
目标检测与目标跟踪：区别与联系 Channon_ 图像处理图像识别
目标检测和跟踪的区别在于对于运动中变化目标的跟踪能力。设想这样一个场景：孙悟空在飞行过程中完成了一次变化（这里假设他变成了一只鸟），但这个变化并不是像西游记拍摄中有烟雾特效完成的，而就是通过身体结构发生渐变来完成的，这种情况下，检测器应该会在后续的检测任务中失败，因为设计好的检测器只是为了检测目标孙悟空的存在，孙悟空变身之后已经不存在这个目标，检测器是不会有火眼金睛继续检测到变化后的孙悟空的。但是
MAML-Tracker：用目标检测思路做目标跟踪？小样本即可得高准确率丨CVPR 2020 AI科技大本营
来源|微软研究院AI头条（ID:MSRAsia）编者按：目标检测与目标跟踪这两个任务有着密切的联系。针对目标跟踪任务，微软亚洲研究院提出了一种通过目标检测技术来解决的新视角，采用简洁、统一而高效的“目标检测+小样本学习”框架，在多个主流数据集上均取得了杰出性能。目标跟踪（Objecttracking）与目标检测（Objectdetection）是计算机视觉中两个经典的基础任务。跟踪任务需要由用户指
运动图像目标检测与跟踪简述 try_again_later
运动图像跟踪问题分为目标检测与目标跟踪两部分一、目标检测目标检测即为从序列图像中将变化区域从背景图像中提取出来，依照目标与相机之间的关系可以分为静态背景下运动检测与动态背景下运动检测。1、静态背景指的是相机在监视过程中不发生移动，检测目标在相机视场内运动，只有目标相对于相机的运动。●背景差分法：利用当前图像与背景图像的差分来检测运动区域。思想：先获得一个背景模型，将当前帧与背景模型相减，如果像素差
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

VOT 2017挑战赛——目标追踪相关分享

VOT 竞赛，检验当前单目标追踪最高标准

你可能感兴趣的:(目标检测与目标跟踪)