用于多目标检测的自监督学习(SELF-SUPER VISED LEARNING FOR MULTIPLE OBJECTDETECTION)

在本章中,我们提出了一种新的自监督学习(SSL)技术,以从头顶图像中提供关于实例分割不确定性的模型信息。我们的SSL方法通过使用测试时数据增强和基于回归的旋转不变伪标签细化技术来改进对象检测。我们的伪标签生成方法提供多个经过几何变换的图像作为卷积神经网(CNN)的输入,对网络生成的增强检测进行回归以减少定位误差,然后使用均值偏移算法对其进行聚类。自监督检测器模型可以在单个相机跟踪算法中使用,以生成目标的时间标识符。

3.1简介

自动视频监控需要检测、跟踪和识别场景中感兴趣的对象。在拥挤的场景中进行精确的监控是最具挑战性的计算机视觉应用之一。为了解决机场检查站安全领域的视觉监控问题,东北大学国土安全部ALERT(爆炸相关威胁的意识和定位)卓越中心启动了CLASP(关联行李和特定乘客)项目。这项举措旨在帮助美国运输安全管理局(TSA)发现安全事件,如物品和废弃袋子被盗。

目前在机场检查站检测和跟踪乘客和行李的方法将每个摄像头视野内的图像区域划分为预期乘客行为的感兴趣区域(例如,乘客他们的物品在滚筒输送机附近)[169170]。虽然这些方法在感兴趣的个别地区是有效的,但它们无法在整个检查站检测和跟踪乘客及其物品。此外,由于使用非常规相机视角获得的大规模数据集不可用,最新的检测算法[6171,7172]无法在逼真的头顶相机场景中检测多个对象。

使用人类注释标签微调预先训练的模型是计算机视觉方法中的一种常见方法。然而,这种策略阻碍了最先进算法在从现有公开数据集中不常见的视角获得图像的场景中的适用性。

机场检查站使用的视频监控系统具有巨大的可变性

你可能感兴趣的:(目标检测,学习,人工智能)