【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition

论文题目:Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition
论文出处:Computer Vision and Pattern Recognition(CVPR)2021
论文链接:文章下载
代码链接:代码

一、贡献

1、提出了一个高质量X射线(HiXray)安全检查图像数据集,包含8类102,928个常见违禁物品。这是世界上最大的违禁物品检测高质量数据集,来自真实世界的机场安检,由专业安检人员批注。该数据集也可用于小目标检测和遮挡目标检测任务。
2、为了准确地检测违禁物品,提出了多角度抑制模块(Lateral Inhibition Module, LIM),该模块的灵感来自于人类通过忽略无关信息和关注可识别的特征来识别物品,特别是当物体相互重叠时。其中,精心设计的灵活附加模块LIM通过双向传播(BP)模块最大限度地抑制噪声信息,通过边界激活(BA)模块从四个方向激活最具识别力的边界。

二、数据集

2.1 现有数据集对比

【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第1张图片
上图对HiXray数据集和现有的X射线图像进行了对比,对比的标准包括:类别、数量、注释、颜色、任务以及数据集来源。

2.2 HiXray数据集组成

【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第2张图片

2.3 图片中的目标数量

【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第3张图片

2.4 不同物体在X射线下的颜色

【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第4张图片

2.5 HiXray数据集的应用

- 小目标检测
小目标(Small)定义为:ground-truth边界框在整个图像中所占比例小于0.1%。
大目标(Large)定义为:ground-truth边界框在整个图像中所占比例大于0.2%。
介于二者中间的为Medium。
【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第5张图片
-遮挡目标检测
行李或手提箱内的物品往往相互重叠,造成X射线检测违禁物品时的遮挡问题,图3中的数据能够大体反映出这个特性。

三、多角度抑制模块(Lateral Inhibition Module)

受相邻神经元的多角度抑制使网络更加高效的机制的启发,本文提出了多角度抑制模块(lateral Inhibition Module, LIM)。LIM包括两个核心子模块,即双向传播(Bidirectional Propagation,BP)和边界激活(Boundary Activation,BA)。

3.1 LIM网络结构

【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第6张图片
上图中,BP用来过滤噪声信号,抑制邻近区域对目标区域的影响;BA用来激活边界作为物体识别的属性。

3.2 BP

在类似FPN的基础上,使用密集机制来增强BP选择合适信息进行传播的能力。

3.3 BA

为了模拟多角度抑制对刺激进行对比来增加感官感知,作者从每个层的输出特征图内部的四个方向强化边界信息,并将它们聚合成一个整体特征图来激活边界信息。
捕获目标边界的关键是确定边界点的位置,假设想捕获特征图Al∈RH*W*C中对象的左边界,AlC表示特征图Al的C通道,AlijC表示特征图中C通道的位置(i,j),为了确定一个点的位置是否和左边的点之间有剧烈的变化,使用最右边的点AliWC向左遍历,如下图所示:在这里插入图片描述
BlijC表示经过边界激活后特征图Bl的C通道(i,j)位置。
同理,可以对特征图进行上下左右四个方向的边界激活,如下图所示。
【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第7张图片

四、实验验证

4.1 检测模型之间的对比

【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第8张图片

4.2 FPN策略之间的对比

【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第9张图片

4.3 消融实验

【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第10张图片

4.4 可视化

【论文解读】Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition_第11张图片
从上图可以看出,LIM可以有效提高目标检测率并且提高目标的定位精度。

五、总结

  • 该论文提出了一个高质量的X射线扫描数据集
  • 提出了多角度抑制模块(LIM)来提高检测能力
  • LIM对能够提高目标的定位精度

注意:本博客的初衷是用做个人笔记并进行交流探讨,由于个人能力有限,若存在解读错误问题,或者您在阅读本文有不理解的地方,欢迎指正交流。

你可能感兴趣的:(论文解读,计算机视觉,目标检测,深度学习)