AI City challenge2018冠军论文阅读

原文:论文
代码:github
这个队伍的想法很创新,首先他对于SCT,没有采用深度学习提取特征的这种方法,而是偏向使用图像图形学的知识,而且对于mtmc的处理,大部分论文使用了聚类的办法,但是它采用了计算非训练的方法,经由reid之后,去一一匹配。
下面说一下他的创新点:首先进行相机校准。
为什么要进行相机校准呢:在多镜头多目标的追踪下,需要利用不同镜头下的物体视觉信息,减少被遮挡区域,并且提供目标和场景的3D信息,相机视图对于3D场景有畸变作用,比如你不能确定远处的物体到底有多远,所以要使用相机校准还原3D场景。
AI City challenge2018冠军论文阅读_第1张图片

相机校准

现附上一位大佬的博客吧:3D重建之相机校准
简而言之,相机拍照会经历3个坐标系:图像坐标系,相机坐标系,世界坐标系。相机的参数分为两个:相机内参和相机外参,内参用于相机坐标系投影到图像像素,外参用于将世界坐标系投影到相机坐标系。内参一般是不随时间变化的,可以通过matlab等校准工具求得,外参需要在实际过程中求得。
在这个比赛里,他们对相机校准进行了优化,首先他们在相机图像上选了n段直线,记录他们的坐标(x,y),然后通过参数矩阵把它投到了3D中,然后使用了Google map来获取真实制的坐标,并且计算预估值和真实值的误差,来反复校准相机参数(EDA算法)。

MCT

这里使用聚类方法实现SCT的,聚类的特征由几样:轨道预测偏差,速度,时间,appearance。轨道预测的方法是使用高斯回归过程完成轨道预测。高斯回归过程是啥可以看看我之前的博客。这里appearance采用了五种颜色的直方图。这里有人会问,为啥不用feature,feature里面都有颜色的信息呀,我觉得可能是feature信息太多了,颜色信息混杂在里面不好辨认吧。这里关于聚类的方式,它使用了五种聚类方式,然后一一比较选择。

ICT

这里方法像聚类但不同于聚类,如果有MCT的物体没有在ICT中出现,聚类反而是一种干扰,所以这里用loss来进行筛选。
首先过滤出SCT中不满足帧长和bbox大小的物体,然后经由reid,筛出ranking靠前的几张,然后由
appearance,DCNN,license OCR,car type,traveling time几个特征分别计算出loss,然后选择loss乘积小于阈值的物体。

你可能感兴趣的:(CV大白菜,MCT,ICT)