多光谱行人检测(一)Multispectral Pedestrian Detection:Benchmark Dataset and Baseline

这篇文章最主要的是制作了KIAST数据集,直到现在仍有许多人使用这个数据集进行多光谱行人检测。虽然提出ACF方法在后续文章作为对比算法,但是因为深度学习的快速发展,后续工作很少基于ACF进行改进。

这篇文章提出了一个多光谱行人数据集,该数据集由基于分束器的特殊硬件捕获,提供良好的颜色-热图像对。颜色热数据集和以前基于颜色的数据集一样大,并提供了密集的注释,包括时间对应。利用该数据集,同时引入了多光谱ACF,它是聚合通道特征(ACF)的扩展,可以同时处理彩色-热图像对。多谱ACF使得ACF的平均漏检率降低了15%,实现了行人检测任务的又一突破。

文章目录

    • 1. 主要贡献
    • 2. 数据采集
    • 3. 数据集介绍
      • 3.1 数据规模
      • 3.2 行人遮挡
      • 3.3 行人位置
      • 3.4 行人外观变化
    • 4. 行人检测基线
      • 4.1 标准 ACF
      • 4.2 多光谱 ACF


的多光谱行人数据集的例子。它将从白天/晚上的交通场景中捕获的彩色(左列)和热(右列)图像对齐。数据集提供的绿色、黄色和红色框分别表示无遮挡、部分遮挡和重度遮挡。

1. 主要贡献

  1. 引入了多光谱行人数据集,提供了对齐的颜色和热图像对。的数据集的图像帧数和广泛使用的行人数据集一样多[10,15]。该数据集还包含以前的数据集中很少提供或讨论的夜间流量序列。
  2. 分析了颜色通道和热通道的互补关系,提出了如何结合两种通道的优点,而不是单独使用颜色通道或热通道。
  3. 提出了几种带有热通道的扩展ACF的组合。扩展在提出的多光谱行人数据集上减少了15%的平均漏报率。与以往大多数数据集利用彩色热立体设置相比,使用基于分束器的硬件来物理对齐两个图像域。第一个在白天和晚上提供对齐的彩色和热图像对的数据集。

2. 数据采集

硬件规格如上图所示,开发了由彩色摄像机、热摄像机、分束器和三轴摄像机夹具组成的成像硬件。
彩色相机640×480像素的空间分辨率与103.6◦垂直视野。热相机有320 × 256像素的空间分辨率与39◦垂直视野。请注意,彩色相机的视场比热成像相机大。通过牺牲彩色图像的边缘区域来使用原始热图像在对齐图像域。两个摄像头的帧率等于20fps。

相机标定。硬件的概念是由Bienkowski等人引入的,用于无损评估目的。由于[3]中没有提到对两个图像域的校准方法,所以在这里简要介绍的校准方法。首先,利用立体摄像机标定计算安装在硬件上的两个摄像机之间的平移。在这里,可以认为两个相机的光轴超过分束器是平行的,由于硬连线的安排。因此,两个图像域之间只存在平移,只使用三轴夹具调整摄像机位置,直到平移为零。调整后,两个图像域被矫正为具有相同的虚拟焦距。经过这些步骤,两个图像域具有相同的焦距和相同的主点,并且没有基线。虚拟对齐的图像域有640×512像素的空间分辨率,并有39°垂直视野,这是类似于人类的视觉。由于传统的棋盘图案在热成像相机中是无法观察到的,使用了一个特殊的标定板[16,17],它有一些孔。当它被加热时,在板和孔之间有一个温度差,因此可以在热成像相机中观察到。图3所示为孔模式图像的示例。
多光谱行人检测(一)Multispectral Pedestrian Detection:Benchmark Dataset and Baseline_第1张图片

硬件安装在车顶上,用于捕捉以自我为中心的交通场景图像。特别的是,在白天和晚上捕捉了各种场景,以考虑光照条件的变化。在捕获的帧中,95328对彩色热对图像进行手工标注,总共有103128个密集标注和1182个独特的行人。为了标注地面的真实情况,使用了Piotr的计算机视觉工具箱[8],但它被修改为同时显示彩色和热图像。修改有助于注释,因为在夜间,在颜色通道中很难看到远处的行人。还修改了工具箱,为每个边界框提供遮挡标记,而不是遮挡区域。类似于Dollár等[10],该对象有四个标签中的一个。很明显,一个行人被标记为“人”。无法区分的个体被贴上了人的标签。骑两轮交通工具的人被称为骑自行车的人。在高度混乱的场景中,即使是人类注释者有时也不能清楚地确定一个人形物体是否是行人。这个物体被标记为人?它在计算中被忽略了。在注释之后,边界框还具有指示帧上的人员索引的时间对应。在的数据集中,一个人平均出现74.80帧(相当于3.74秒)。

3. 数据集介绍

3.1 数据规模

多光谱行人检测(一)Multispectral Pedestrian Detection:Benchmark Dataset and Baseline_第2张图片
规模。由于行人检测的关键应用是避免事故,根据车辆制动距离对标注的边界盒大小进行分类。在行人经常出现的市区,认为一般车速为30至55公里/小时。在这种驾驶条件下,预期的制动距离为11 ~ 28米(包括驾驶员反应造成的制动延迟)[7]。如果行人的高度约为1.7米,那么在对齐的图像域中,这对应于45 ~ 115像素的高度。将这些大小的注释分类为介质。如图5(a)所示,也确定了远近,即小于或大于中等。图5(b)显示了以像素为单位的行人高度与其对应的距离(以米为单位)的关系。

3.2 行人遮挡

如果一个行人突然被场景中的其他行人或物体遮挡,用三个遮挡标签中的一个来标注。没有被遮挡的行人被标记为没有遮挡;那些在一定程度上闭塞了一半以上的被标记为部分闭塞;轮廓大部分被遮挡的被标记为重遮挡。在所有标注中,75%以上的行人被标注为未遮挡(78.6%),其余为部分遮挡(12.6%)和重度遮挡(8.8%)。

3.3 行人位置

多光谱行人检测(一)Multispectral Pedestrian Detection:Benchmark Dataset and Baseline_第3张图片
图6 (a)是用混合高斯模型的分布表示的标注行人的中心。的硬件被设置为覆盖一般驱动程序的视图。这个设置限制了行人在特定区域的外观。因此,行人分布在图像中心的一个窄带内。行人多出现在图像的右侧,因为汽车是在右向交通条件下行驶。还在图6 (b)中以对数标准化的比例显示了每帧的行人数量。

3.4 行人外观变化

多光谱行人检测(一)Multispectral Pedestrian Detection:Benchmark Dataset and Baseline_第4张图片

图7显示了白天和晚上行人的几个例子。由于强烈的阳光,白天的彩色图像显示出独特的人体形状。另一方面,由于黑暗的环境,夜间彩色图像中的形状无法区分。然而,热图像在夜间显示出明显的形状,因为当空气温度较低时,温差更大,所以可以清楚地捕捉到固定温度的行人在夜间。在白天,强烈的太阳辐射造成背景杂波。基于这些原因,可以期望通过全天使用彩色和热图像的优点来获得更好的性能。

4. 行人检测基线

为了有效地处理颜色和热通道,基线算法建立在聚合通道特征(ACF)行人检测器[9]的基础上。这是一种自然的选择,因为算法可以容纳显示不同模式的多个通道。例如,它使用单色图像的彩色和渐变通道。这样,热通道可以看作是该算法中另一个增强的通道。在这里,受益于的捕获硬件,因为颜色和热通道之间的对齐问题被删除。此外,ACF行人检测器被广泛用作并行最先进的行人检测器的基算法。有了这个想法,首先回顾了为彩色图像设计的标准ACF,并介绍了的扩展来额外处理热通道。

4.1 标准 ACF

对于彩色图像输入,标准ACF[9]有10个增强通道(LUV+M+O): LUV表示颜色空间的3个通道,M表示1个梯度幅值通道,O表示6个梯度直方图通道,是定向梯度直方图(HOG)[4]的简化版本。在ACF[9]中,他们利用了引导过程,从大量的底片中挖掘硬底片,并多次重新训练AdaBoost分类器[1]。最后,他们应用了一种称为软级联的有效抑制方法来提高检测时间。通过这种方法,构建了一个功能强大的行人检测框架。

4.2 多光谱 ACF

利用ACF行人检测器作为的基线,并将其扩展为热强度通道编码。对于扩展,建议三个基线:(1)ACF+T (2) ACF+T+TM+TO (3) ACF+T+THOG。ACF是前面提到的为颜色通道定义的特性。T、T+TM+TO和T+THOG表示热通道增加的额外通道特性。

  • T 该通道特性直接利用热强度。为了提高检测性能,使用直方图均衡化增强了图像的对比度。
  • T + TM +TO。这个扩展包括三个渠道:T, TM和TO。T为上述热通道,TM为热图像的归一化梯度幅值,TO为热图像的定向梯度直方图。TM和TO采用与标准ACF相同的方法获得。
  • T + THOG。该扩展使用热图像的T和HOG特征(表示为THOG)。与计算6个直方图方向相比,THOG计算更多的梯度方向,并且在局部直方图上有额外的归一化步骤。

多光谱行人检测(一)Multispectral Pedestrian Detection:Benchmark Dataset and Baseline_第5张图片
这三个扩展利用了热通道的强度和梯度信息。利用热图像的梯度作为一个重要的线索。在不同的条件下对这些扩展进行了自我评估:不同的尺度、遮挡标记和捕获时间(白天或夜晚)。图10的结果表明,三种扩展的性能都优于ACF,其中ACF+T+THOG的性能最好。这是因为ACF+T+THOG有最详尽的人形表示。基于这一观察结果,选择了ACF+T+THOG作为理想的信道特性组合,并对其进行了分析。
多光谱行人检测(一)Multispectral Pedestrian Detection:Benchmark Dataset and Baseline_第6张图片

你可能感兴趣的:(多光谱行人检测,行人检测)