【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(6月 30 日论文合集)

文章目录

  • 一、检测相关(8篇)
    • 1.1 Detect Any Deepfakes: Segment Anything Meets Face Forgery Detection and Localization
    • 1.2 Sustainable Palm Tree Farming: Leveraging IoT and Multi-Modal Data for Early Detection and Mapping of Red Palm Weevil
    • 1.3 Evaluation of Environmental Conditions on Object Detection using Oriented Bounding Boxes for AR Applications
    • 1.4 Metric-aligned Sample Selection and Critical Feature Sampling for Oriented Object Detection
    • 1.5 Real-Time Fully Unsupervised Domain Adaptation for Lane Detection in Autonomous Driving
    • 1.6 Improving Fairness in Deepfake Detection
    • 1.7 A systematic study of the foreground-background imbalance problem in deep learning for object detection
    • 1.8 The State of Applying Artificial Intelligence to Tissue Imaging for Cancer Research and Early Detection

一、检测相关(8篇)

1.1 Detect Any Deepfakes: Segment Anything Meets Face Forgery Detection and Localization

检测任何深度伪装:分割任何符合人脸的伪装检测和定位

论文地址:

https://arxiv.org/abs/2306.17075

在这里插入图片描述
计算机视觉的快速发展刺激了面部伪造技术的显著进步,引起了致力于检测伪造和精确定位操纵区域的研究人员的关注。尽管如此,在有限的细粒度像素监督标签的情况下,deepfake检测模型在精确的伪造检测和定位方面表现不尽如人意。为了解决这一挑战,我们引入了训练有素的视觉分割基础模型,即,分割任意模型(SAM)在人脸伪造检测和定位中的应用。基于SAM,我们提出了带有多尺度适配器的检测任何深度伪造(DADF)框架,该框架可以捕获短距离和长距离伪造上下文以进行有效的微调。此外,为了更好地识别伪造的痕迹和增强模型对伪造区域的敏感性,提出了重建引导注意(RGA)模块。所提出的框架无缝集成端到端伪造定位和检测优化。在三个基准数据集上进行的大量实验表明了我们的方法在伪造检测和定位方面的优越性。这些代码将很快在www.example.com上发布https://github.com/laiyingxin2/DADF。

1.2 Sustainable Palm Tree Farming: Leveraging IoT and Multi-Modal Data for Early Detection and Mapping of Red Palm Weevil

可持续棕榈树养殖:利用物联网和多模式数据早期检测和绘制红棕榈象甲

论文地址:

https://arxiv.org/abs/2306.16862

在这里插入图片描述
红棕榈象鼻虫(RPW)是一种高度破坏性的昆虫,造成经济损失并影响全球棕榈树种植。本文提出了一种创新的方法,可持续的棕榈树农业利用先进的技术,早期检测和管理的RPW。我们的方法结合了计算机视觉,深度学习(DL),物联网(IoT)和地理空间数据,以有效地检测和分类RPW出没的棕榈树。主要阶段包括:(1)使用来自IoT设备的声音数据的DL分类,(2)使用UAV图像上的YOLOv8进行棕榈树检测,以及(3)使用地理空间数据的RPW映射。我们的自定义DL模型在检测和定位受感染的棕榈树方面实现了100%的准确率和召回率。整合地理空间数据可以创建一个全面的RPW分布图,以实现有效的监控和有针对性的管理策略。这种技术驱动的方法有利于农业当局,农民和研究人员管理RPW侵扰和保护棕榈树种植园的生产力。

1.3 Evaluation of Environmental Conditions on Object Detection using Oriented Bounding Boxes for AR Applications

用于AR应用的定向包围盒目标检测的环境条件评估

论文地址:

https://arxiv.org/abs/2306.16798

在这里插入图片描述

增强现实(AR)的目标是将数字内容添加到自然图像和视频中,以在用户和环境之间创建交互式体验。场景分析和对象识别在AR中起着至关重要的作用,因为它们必须快速准确地执行。在这项研究中,提出了一种新方法,该方法涉及使用具有检测和识别深度网络的定向边界框来提高性能和处理时间。该方法使用两个数据集进行评估:通常用于计算机视觉任务的真实图像数据集(DOTA数据集),以及模拟不同环境、照明和采集条件的合成数据集。评估的重点是难以检测和识别的小物体。结果表明,所提出的方法往往会产生更好的平均精度和更高的精度为小对象在大多数测试条件。

1.4 Metric-aligned Sample Selection and Critical Feature Sampling for Oriented Object Detection

面向目标检测的度量对齐样本选择和关键特征采样

论文地址:

https://arxiv.org/abs/2306.16718

在这里插入图片描述
面向任意对象的目标检测是一个相对新兴但具有挑战性的任务。虽然已经取得了显着的进展,仍然存在许多未解决的问题,由于在航空图像中的对象的方向,比例,纵横比和视觉外观的图案的大的多样性。现有的方法大多采用粗粒度的固定标签分配策略,并且遭受分类得分和定位精度之间的不一致。首先,针对固定IoU策略导致的样本选择和回归损失计算之间的度量不一致,引入仿射变换来评估样本质量,并提出了一种基于距离的标签分配策略。提出的度量对齐选择(MAS)策略可以根据对象的形状和旋转特性动态地选择样本。其次,为了进一步解决分类和本地化之间的不一致,我们提出了一个关键特征采样(CFS)模块,该模块对分类任务的采样位置进行本地化细化,以准确地提取关键特征。第三,我们提出了一个规模控制的平滑L_1损失(SC-Loss),通过改变回归损失函数的形式,在训练过程中的统计建议的基础上,自适应地选择高质量的样本。在四个具有挑战性的旋转对象检测数据集DOTA,FAIR 1 M-1.0,HRSC 2016和UCAS-AOD上进行了广泛的实验。结果显示了所提出的检测器的最先进的精度。

1.5 Real-Time Fully Unsupervised Domain Adaptation for Lane Detection in Autonomous Driving

用于自动驾驶车道检测的实时全无监督区域自适应算法

论文地址:

https://arxiv.org/abs/2306.16660

在这里插入图片描述
虽然深度神经网络被大量用于自动驾驶,但它们需要适应新的未知环境条件。我们专注于车道检测的安全关键应用,并提出了一种轻量级的,完全无监督的,实时的自适应方法,只适应批量归一化参数的模型。我们证明,我们的技术可以执行推理,然后在设备上的适应,在Nvidia Jetson奥林30 FPS的严格约束下。其显示类似的准确度(avg.的92.19%)作为最先进的半监督自适应算法,但是其不支持实时自适应。

1.6 Improving Fairness in Deepfake Detection

提高深伪检测的公平性

论文地址:

https://arxiv.org/abs/2306.16635

在这里插入图片描述
尽管近年来开发了有效的deepfake检测模型,但最近的几项研究表明,用于开发deepfake检测模型的训练数据中的偏差可能会导致不同种族和/或性别的人口群体的不公平表现。这可能导致这些群体被不公平地定位或排除在检测之外,从而允许错误分类的深度伪造操纵公众舆论并侵蚀对模型的信任。虽然这些研究集中在识别和评估深度伪造检测中的不公平性,但尚未开发出在算法层面解决深度伪造检测的公平性问题的方法。在这项工作中,我们首次尝试通过提出新的损失函数来提高deepfake检测的公平性,以不可知或了解人口统计因素的方式训练公平的deepfake检测模型。在四个deepfake数据集和五个deepfake检测器上进行的广泛实验证明了我们的方法在提高deepfake检测公平性方面的有效性和灵活性。

1.7 A systematic study of the foreground-background imbalance problem in deep learning for object detection

深度学习目标检测中前景背景不平衡问题的系统研究

论文地址:

https://arxiv.org/abs/2306.16539

在这里插入图片描述
深度学习中的类不平衡问题已经在几项研究中进行了探索,但在对象检测中还没有对这种现象进行系统的分析。在这里,我们提出了全面的分析和实验的前景-背景(F-B)的不平衡问题,在对象检测,这是非常常见的,所造成的小,罕见的感兴趣的对象。我们通过实验研究了F-B不平衡的不同方面(对象大小,对象数量,数据集大小,对象类型)对检测性能的影响。此外,我们还比较了9种解决这个问题的主要方法,包括Faster-RCNN,SSD,OHEM,Libra-RCNN,Focal-Loss,GHM,PISA,YOLO-v3和GFL,以及来自不同成像领域的一系列数据集。我们的结论是(1)F-B不平衡确实会导致检测性能的显著下降,(2)当较少的训练数据可用时,检测性能更受F-B不平衡的影响,(3)在大多数情况下,减小对象尺寸比减小对象数量导致更大的性能下降,给定对象像素与非对象像素的比率的相同变化,(6)在所有选择的方法中,Libra-RCNN和PISA在解决F-B失衡问题方面表现最好。(7)当训练数据集很大时,方法的选择没有影响力(8)软采样方法,包括焦点损失,GHM和GFL,平均表现相当好,但相对不稳定。

1.8 The State of Applying Artificial Intelligence to Tissue Imaging for Cancer Research and Early Detection

人工智能在组织成像中的应用现状及其在肿瘤研究和早期检测中的应用

论文地址:

https://arxiv.org/abs/2306.16989

在这里插入图片描述
人工智能代表了人类医学的一个新前沿,可以挽救更多的生命,降低成本,从而增加可及性。因此,人工智能在癌症医学成像,特别是组织病理学方面的进步速度已经爆炸,使其面临伦理和技术问题,这些问题可能会阻碍其在现有系统中的采用。为了绘制AI在癌症组织成像中的应用路径,我们回顾了当前的工作,并确定了它如何改善癌症病理学诊断和研究。在这篇综述中,我们确定了模型开发的5个核心任务,包括回归,分类,分割,生成和压缩任务。我们讨论了这些方法所面临的好处和挑战,以及它们如何适用于癌症预防和治疗。本文中的研究代表了这一领域的开始,未来的实验将建立在我们强调的基础上。

你可能感兴趣的:(计算机视觉arxiv最新论文,计算机视觉,目标检测,人工智能)