【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(9 月 7 日论文合集)

文章目录

  • 一、检测相关(5篇)
    • 1.1 Detecting Manufacturing Defects in PCBs via Data-Centric Machine Learning on Solder Paste Inspection Features
    • 1.2 Continual Evidential Deep Learning for Out-of-Distribution Detection
    • 1.3 DMKD: Improving Feature-based Knowledge Distillation for Object Detection Via Dual Masking Augmentation
    • 1.4 SlAction: Non-intrusive, Lightweight Obstructive Sleep Apnea Detection using Infrared Video
    • 1.5 Anatomy-Driven Pathology Detection on Chest X-rays

一、检测相关(5篇)

1.1 Detecting Manufacturing Defects in PCBs via Data-Centric Machine Learning on Solder Paste Inspection Features

基于焊膏检测特征的以数据为中心的机器学习检测印刷电路板制造缺陷

https://arxiv.org/abs/2309.03113

使用焊膏检测(SPI)和自动光学检测(AOI)机器自动检测印刷电路板(PCB)制造中的缺陷,有助于提高运营效率,并显著减少人工干预的需求。在本文中,使用SPI提取的600万引脚的功能,我们展示了一种以数据为中心的方法来训练机器学习(ML)模型来检测PCB制造的三个阶段的PCB缺陷。600万个PCB引脚对应于15,387个PCB的200万个组件。使用基本极端梯度增强(XGBoost)ML模型,我们迭代数据预处理步骤以提高检测性能。结合使用元件和PCB ID的引脚级SPI功能,我们也在元件和PCB级别开发了训练实例。这允许ML模型捕获在引脚级别可能不明显的任何引脚间、组件间或空间效应。在引脚、元件和PCB级别对模型进行训练,并将不同模型的检测结果组合起来以识别有缺陷的元件。

1.2 Continual Evidential Deep Learning for Out-of-Distribution Detection

基于连续证据深度学习的离散型检测

https://arxiv.org/abs/2309.02995

基于不确定性的深度学习模型因其提供准确可靠预测的能力而引起了人们的极大兴趣。证据深度学习在使用单个确定性神经网络检测分布外(OOD)数据方面表现出色。出于这一事实,在本文中,我们提出了一个证据深度学习方法集成到一个持续的学习框架,以同时执行增量对象分类和OOD检测。此外,我们分析了真空和不和谐的能力,以区分属于旧类和OOD数据的分布数据。所提出的方法,称为CEDL,CIFAR-100考虑两个设置,分别由5和10个任务进行评估。从所获得的结果,我们可以理解,所提出的方法,除了提供相对于基线的对象分类中的可比结果之外,在三个评估度量上与若干事后方法相比在很大程度上优于OOD检测:AUROC、AUPR和FPR 95。

1.3 DMKD: Improving Feature-based Knowledge Distillation for Object Detection Via Dual Masking Augmentation

DMKD:通过双掩蔽增强改进基于特征的知识提取用于目标检测

https://arxiv.org/abs/2309.02719

最近的主流掩蔽蒸馏方法的功能,通过重建选择性掩蔽区域的学生网络的教师对应物的特征图。在这些方法中,需要适当地选择掩蔽区域,使得重构的特征像教师特征那样编码足够的区分和表示能力。然而,以前的掩蔽蒸馏方法只专注于空间掩蔽,使得所得掩蔽区域偏向于空间重要性,而不编码信息信道线索。在这项研究中,我们设计了一个双掩蔽知识蒸馏(DMKD)框架,它可以捕捉空间上的重要性和通道明智的信息线索,全面的掩蔽特征重建。更具体地说,我们采用双重注意机制来引导各自的掩蔽分支,导致重建的特征编码双重重要性。此外,融合重建的特征通过自调整加权策略实现有效的特征提取。我们在目标检测任务上的实验表明,当RetinaNet和Cascade Mask R-CNN分别用作教师网络时,学生网络在我们的方法的帮助下实现了4.1%和4.3%的性能增益,同时优于其他最先进的蒸馏方法。

1.4 SlAction: Non-intrusive, Lightweight Obstructive Sleep Apnea Detection using Infrared Video

SLAction:使用红外视频的非侵入性、轻量级阻塞性睡眠呼吸暂停检测

https://arxiv.org/abs/2309.02713

阻塞性睡眠呼吸暂停(OSA)是一种普遍的睡眠障碍,影响全世界约10亿人。目前诊断OSA的黄金标准,多导睡眠图(PSG),涉及使用多个连接的传感器过夜住院,由于第一夜效应,导致潜在的不准确性。为了解决这个问题,我们提出了SlAction,一个非侵入性OSA检测系统的日常睡眠环境使用红外视频。认识到睡眠视频表现出最小的运动,这项工作研究了基本问题:“呼吸事件是否充分反映在睡眠期间的人体运动中?“通过分析5,098小时的最大睡眠视频数据集,我们建立了OSA事件与睡眠期间人体运动之间的相关性。我们的方法使用低帧速率(2.5 FPS),大尺寸(60秒)和步骤(30秒)的滑动窗口分析,以捕获缓慢和长期的运动相关的OSA。此外,我们还为资源受限的设备使用了一个轻量级的深度神经网络,确保所有视频流都在本地处理,而不会影响隐私。评估表明,SlAction在各种环境中检测OSA时达到了87.6%的平均F1得分。在NVIDIA Jetson Nano上实施SlAction可实现实时推理(60秒视频剪辑约为3秒),突出了其早期检测和个性化治疗OSA的潜力。

1.5 Anatomy-Driven Pathology Detection on Chest X-rays

胸部X线片的解剖驱动病理检测

https://arxiv.org/abs/2309.02578

病理学检测和描绘使得能够自动解释医学扫描(诸如胸部X射线),同时提供高水平的解释性以支持放射科医师做出明智的决定。然而,注释病理学边界框是一项耗时的任务,使得用于此目的的大型公共数据集是稀缺的。因此,当前的方法使用弱监督对象检测来学习来自图像级注释的病理的(粗略)定位,然而,由于缺乏边界框监督,这在性能上是有限的。因此,我们提出了解剖驱动的病理检测(ADPD),它使用易于注释的解剖区域的边界框作为病理代理。我们研究了两种培训方法:使用解剖学级病理学标签的监督训练和具有图像级病理学标签的多实例学习(MIL)。我们的研究结果表明,我们的解剖学水平的训练方法优于弱监督方法和完全监督检测有限的训练样本,我们的MIL方法是竞争的两种基线方法,因此证明了我们的方法的潜力。

你可能感兴趣的:(计算机视觉arxiv最新论文,计算机视觉,目标检测,人工智能)