旅途中的宽~

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递（5月30日论文合集）

文章目录

一、检测相关(16篇)
- 1.1 Contextual Object Detection with Multimodal Large Language Models
- 1.2 Towards minimizing efforts for Morphing Attacks -- Deep embeddings for morphing pair selection and improved Morphing Attack Detection
- 1.3 Mining Negative Temporal Contexts For False Positive Suppression In Real-Time Ultrasound Lesion Detection
- 1.4 Pedestrian detection with high-resolution event camera
- 1.5 View-to-Label: Multi-View Consistency for Self-Supervised 3D Object Detection
- 1.6 CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion Models
- 1.7 T2FNorm: Extremely Simple Scaled Train-time Feature Normalization for OOD Detection
- 1.8 Real-time Object Detection: YOLOv1 Re-Implementation in PyTorch
- 1.9 Lighting and Rotation Invariant Real-time Vehicle Wheel Detector based on YOLOv5
- 1.10 Image Hash Minimization for Tamper Detection
- 1.11 k-NNN: Nearest Neighbors of Neighbors for Anomaly Detection
- 1.12 Deep Learning based Fingerprint Presentation Attack Detection: A Comprehensive Survey
- 1.13 FishEye8K: A Benchmark and Dataset for Fisheye Camera Object Detection
- 1.14 Robust Lane Detection through Self Pre-training with Masked Sequential Autoencoders and Fine-tuning with Customized PolyLoss
- 1.15 VoxDet: Voxel Learning for Novel Instance Detection
- 1.16 Building One-class Detector for Anything: Open-vocabulary Zero-shot OOD Detection Using Text-image Models

一、检测相关(16篇)

1.1 Contextual Object Detection with Multimodal Large Language Models

基于多通道大语言模型的上下文对象检测

论文地址：

https://arxiv.org/abs/2305.18279

最近的多模态大语言模型（MLLM）在视觉语言任务（例如图像字幕和问答）中是显著的，但是缺乏必要的感知能力，即，物体检测在这项工作中，我们通过引入上下文对象检测的新研究问题来解决这一限制-在不同的人类-AI交互上下文中理解可见对象。三个有代表性的场景，包括语言完形填空，视觉字幕，和问答。此外，我们提出了ContextDET，一个统一的多模态模型，能够端到端的视觉语言上下文的可区分建模，以便定位，识别和关联视觉对象与语言输入的人与人工智能的互动。我们的ContextDET涉及三个关键子模型：（i）用于提取视觉表示的视觉编码器，（ii）用于多模态上下文解码的预训练LLM，以及（iii）用于预测给定上下文对象词的边界框的视觉解码器。新的生成然后检测框架使我们能够检测人类词汇中的对象词。大量的实验表明，我们提出的代码基准，开放词汇检测，并参考图像分割的ContextDET的优势。Github：https://github.com/yuhangzang/ContextDET。

1.2 Towards minimizing efforts for Morphing Attacks – Deep embeddings for morphing pair selection and improved Morphing Attack Detection

使变形攻击的努力最小化–用于变形对选择的深度嵌入和改进的变形攻击检测

论文地址：

https://arxiv.org/abs/2305.18216

人脸变形攻击对身份证件的安全性构成威胁，特别是对于随后的访问控制过程，因为它使所涉及的两个人都能够利用同一个文件。在这项研究中，人脸嵌入有两个目的：预先选择用于大规模变形攻击生成的图像并检测潜在的变形攻击。我们建立在以前的嵌入研究在这两个用例中使用MagFace模型。对于第一个目标，我们采用了预先选择算法，对个人的基础上，面对嵌入相似性。我们量化了不同变形的人脸图像的攻击潜力，以比较自动生成许多成功的变形攻击中预选的可用性。关于第二个目标，我们比较嵌入从两个国家的最先进的人脸识别系统的检测变形攻击的能力。我们的研究结果表明，ArcFace和MagFace提供了有价值的人脸嵌入图像预选。开源和COTS人脸识别系统都容易受到生成攻击的影响，特别是当预选是基于嵌入而不是随机配对时，随机配对仅受软生物特征的约束。更准确的人脸识别系统表现出更大的攻击脆弱性，COTS系统是最容易受到攻击的。此外，与以前使用的ArcFace嵌入相比，MagFace嵌入可以作为检测变形人脸图像的强大替代方案。实验结果证实了人脸嵌入在人脸变形图像预选择和变形后人脸图像检测方面的优势。对各种设计攻击的广泛分析支持了这一点。MagFace模型被证明是一个强大的替代常用的ArcFace模型的目标，预选和攻击检测。

1.3 Mining Negative Temporal Contexts For False Positive Suppression In Real-Time Ultrasound Lesion Detection

实时超声病变检测中用于假阳性抑制的负时间上下文挖掘

论文地址：

https://arxiv.org/abs/2305.18060

在超声扫描过程中，实时病变检测可以帮助放射科医生进行准确的癌症诊断。然而，这一重要任务仍然具有挑战性，而且探索不足。通用实时对象检测模型在应用于超声视频时可能会错误地报告明显的假阳性（FP），这可能会误导初级放射科医生。一个关键问题是它们未能利用先前帧中的阴性症状，表示为阴性时间上下文（NTC）。为了解决这个问题，我们建议提取上下文从以前的帧，包括NTC，与反向光流的指导。通过聚合提取的上下文，我们赋予该模型的能力，以抑制FP利用NTC。我们将生成的模型称为UltraDet。所提出的UltraDet表现出显着的改进，比以前的国家的最先进的，并实现实时推理速度。为了方便未来的研究，我们将发布实验中使用的CVA-BUS数据集的代码，检查点和高质量标签。

1.4 Pedestrian detection with high-resolution event camera

利用高分辨率事件摄像机进行行人检测

论文地址：

https://arxiv.org/abs/2305.18008

尽管计算机视觉算法不断发展，但无人机和自动驾驶汽车等自动驾驶车辆的感知和控制系统的实现仍然面临许多挑战。由传统相机捕获的视频流通常易于出现诸如运动模糊或由于挑战性的照明条件而导致的图像质量下降的问题。此外，帧速率（通常为每秒30或60帧）在某些场景中可能是限制因素。事件摄像机（DVS -动态视觉传感器）是解决上述问题的潜在有趣技术。在本文中，我们比较了两种通过深度学习处理事件数据的方法，以用于行人检测的任务。我们使用视频帧、卷积神经网络和异步稀疏卷积神经网络形式的表示。所获得的结果说明事件摄像机的潜力，并允许评估用于高分辨率（1280 × 720像素）镜头的方法的准确性和效率。

1.5 View-to-Label: Multi-View Consistency for Self-Supervised 3D Object Detection

视图到标签：自监督三维目标检测的多视点一致性

论文地址：

https://arxiv.org/abs/2305.17972

对于自动驾驶汽车，安全驾驶高度依赖于正确感知3D空间环境的能力，因此3D物体检测的任务代表了感知的基本方面。虽然3D传感器提供精确的度量感知，但单眼方法享有成本和可用性优势，这在广泛的应用中是有价值的。不幸的是，训练单眼方法需要大量的注释数据。有趣的是，自我监督的方法最近已经成功地应用于简化训练过程，并解锁对广泛可用的未标记数据的访问。虽然相关研究利用了包括LIDAR扫描和立体图像的不同先验，但是这样的先验再次限制了可用性。因此，在这项工作中，我们提出了一种新的方法来自我监督3D对象检测纯粹从RGB序列，利用多视图约束和弱标签。我们在KITTI 3D数据集上的实验表明，性能与使用LIDAR扫描或立体图像的最先进的自我监督方法相当。

1.6 CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion Models

伪装扩散：基于条件扩散模型的伪装目标检测

论文地址：

https://arxiv.org/abs/2305.17932

伪装目标检测是计算机视觉中的一个具有挑战性的任务，因为伪装目标与其周围环境具有高度的相似性。现有的COD方法主要采用语义分割，其遭受过度自信的不正确预测。在本文中，我们提出了一个新的范式，把COD作为一个有条件的掩模生成任务，利用扩散模型。我们的方法，被称为CamoDiffusion，采用扩散模型的去噪过程来迭代地降低掩模的噪声。由于扩散的随机采样过程，我们的模型能够从掩模分布中采样多个可能的预测，避免了过度自信的点估计问题。此外，我们还开发了专门的学习策略，其中包括用于生成强大预测的创新集成方法和用于高效训练的定制前向扩散方法，特别是COD任务。在三个COD数据集上进行的广泛实验证明，与现有的最先进的方法相比，我们的模型具有优异的性能，特别是在最具挑战性的COD10K数据集上，我们的方法在MAE方面达到了0.019。

1.7 T2FNorm: Extremely Simple Scaled Train-time Feature Normalization for OOD Detection

T2FNorm：面向OOD检测的极其简单的列车时间尺度特征归一化

论文地址：

https://arxiv.org/abs/2305.17797

神经网络因过度自信的预测器而臭名昭着，这对其在现实世界应用中的安全部署构成了重大挑战。虽然特征归一化在深度学习文献中获得了相当大的关注，但目前用于分布外（OOD）检测的训练时间正则化方法尚未充分利用这一潜力。事实上，神经网络内的特征归一化的天真的合并并不能保证OOD检测性能的改善。在这项工作中，我们引入了T2FNorm，这是一种训练神经网络的新方法，它通过归一化将特征转换到超球面空间，同时采用非转换空间进行OOD评分。该方法在不损害分布（ID）中的模型准确性的情况下产生OOD检测能力的令人惊讶的增强。我们的调查表明，所提出的技术大大减少了所有样本的特征的规范，更是在分布外的样本的情况下，从而解决了神经网络中的过度自信的普遍关注。所提出的方法也显着改善各种事后OOD检测方法。

1.8 Real-time Object Detection: YOLOv1 Re-Implementation in PyTorch

实时目标检测：YOLOv1在PyTorch中的重新实现

论文地址：

https://arxiv.org/abs/2305.17786

实时目标检测是计算机视觉系统需要解决的一个关键问题，它需要根据检测结果及时做出适当的决策。我选择了YOLO v1架构来使用PyTorch框架实现它，目的是熟悉整个对象检测管道，我尝试了不同的技术来修改原始架构以改善结果。最后，我将我的实现的指标与原始的进行比较。

1.9 Lighting and Rotation Invariant Real-time Vehicle Wheel Detector based on YOLOv5

基于YOLOv5的光照和旋转不变实时车轮检测仪

论文地址：

https://arxiv.org/abs/2305.17785

在计算机视觉中，创建对象检测器在最初基于卷积神经网络（CNN）架构开发时具有一些常见的挑战。当创建需要适应由各种相机方向、照明条件和环境变化捕获的图像的模型时，这些挑战更加明显。覆盖所有这些条件的初始训练样本的可用性可能是具有时间和成本负担的巨大挑战。虽然在创建任何类型的对象检测时都可能存在这个问题，但有些类型不太常见，并且没有公开存在的预标记图像数据集。有时，公共数据集对于稀有对象类型既不可靠也不全面。车轮是被选择来演示基于YOLOv5架构创建照明和旋转不变实时检测器的方法的示例之一。我们的目标是提供一个简单的方法，可以用作开发其他类型的实时目标检测器的参考。

1.10 Image Hash Minimization for Tamper Detection

用于篡改检测的图像散列最小化算法

论文地址：

https://arxiv.org/abs/2305.17748

使用图像散列的篡改检测是当今非常常见的问题。已经进行了一些研究和进步来解决这个问题。然而，大多数现有的方法缺乏篡改检测的准确性时，篡改区域是低的，以及需要长的图像哈希。在本文中，我们提出了一种新的方法，客观地最大限度地减少哈希长度，同时提高在低篡改区域的性能。

1.11 k-NNN: Nearest Neighbors of Neighbors for Anomaly Detection

K-NNN：用于异常检测的邻域最近邻

论文地址：

https://arxiv.org/abs/2305.17695

异常检测的目的是识别明显偏离标准的图像。我们专注于算法，在空间中嵌入正常的训练样本，当给定一个测试图像，检测异常的特征距离的k-最近的训练邻居的基础上。我们提出了一个新的运营商，考虑到不同的结构和嵌入空间中的功能的重要性。有趣的是，这不仅要考虑最近的邻居，还要考虑这些邻居的邻居（k-NNN）。我们表明，通过简单地取代我们的k-NNN算子在现有的算法中的最近邻组件，而其余的算法不变，每个算法自己的结果得到改善。对于常见的同构数据集（如特定类型的花或坚果）以及更多样化的数据集，都是如此

1.12 Deep Learning based Fingerprint Presentation Attack Detection: A Comprehensive Survey

基于深度学习的指纹呈现攻击检测研究综述

论文地址：

https://arxiv.org/abs/2305.17522

指纹认证系统的弱点，提出了安全问题时，使他们适应高度安全的访问控制应用程序。因此，指纹呈现攻击检测（FPAD）方法对于确保指纹认证的可靠性至关重要。由于传统的基于手工的方法缺乏生成能力，基于深度学习的FPAD已经成为主流，并在过去十年中取得了显着的表现。现有的评论更多地关注手工制作，而不是基于深度学习的方法，后者已经过时。为了促进未来的研究，我们将只关注最近基于深度学习的FPAD方法。在本文中，我们首先简要介绍了最常见的呈现攻击工具（PAI）和公开可用的指纹呈现攻击（PA）数据集。然后，我们将现有的深度学习FPAD分为接触式、非接触式和基于智能手机的方法。最后，我们通过讨论当前阶段面临的挑战并强调潜在的未来前景来总结本文。

1.13 FishEye8K: A Benchmark and Dataset for Fisheye Camera Object Detection

FishEye8K：鱼眼摄像机目标检测的基准和数据集

论文地址：

https://arxiv.org/abs/2305.17449

随着人工智能的发展，道路对象检测已经成为计算机视觉中的一个突出主题，主要使用透视相机。鱼眼镜头提供了全方位的广泛覆盖，使用较少的摄像机来监控道路交叉口，但与视图失真。据我们所知，目前还没有为鱼眼摄像机上的交通监控准备的开放数据集。本文介绍了一个用于道路对象检测任务的开放式FishEye8K基准数据集，该数据集包括五个类别（行人，自行车，汽车，公共汽车和卡车）的157K边界框。此外，我们还展示了最先进的（SoTA）模型的基准测试结果，包括YOLOv5、YOLOR、YOLO7和YOLOv8的变体。该数据集包括使用18个鱼眼摄像机在台湾新竹进行交通监控的22个视频中记录的8，000张图像，分辨率为1080 $\times$ 1080和 1280 $\times$ 1280。由于超宽全景和半球形鱼眼相机图像具有较大的失真和众多的道路参与者，特别是骑摩托车的人，数据注释和验证过程是艰巨和耗时的。为了避免偏差，来自特定相机的帧被分配到训练集或测试集，每个类别中的图像和边界框的数量保持约70：30的比例。实验结果表明，YOLOv8和YOLOR分别在输入大小为640 $\times$ 640和1280 $\times$ 1280时表现出色。该数据集将在GitHub上提供PASCAL VOC，MS COCO和YOLO注释格式。FishEye8K基准测试将为鱼眼视频分析和智慧城市应用做出重大贡献。

1.14 Robust Lane Detection through Self Pre-training with Masked Sequential Autoencoders and Fine-tuning with Customized PolyLoss

通过使用掩蔽顺序自动编码器进行自我预训练和使用定制PolyLoss进行微调来实现稳健的车道检测

论文地址：

https://arxiv.org/abs/2305.17271

车道线检测是车辆定位的关键，是自动驾驶和许多智能和先进的驾驶辅助系统的基础。现有的基于视觉的车道检测方法没有充分利用有价值的特征和聚合上下文信息，特别是车道线和连续帧中图像的其他区域之间的相互关系。为了填补这一研究空白并提升车道检测性能，本文提出了一种流水线，包括使用掩码顺序自编码器进行自预训练和使用多连续图像帧对端到端神经网络模型进行自定义PolyLoss微调。该算法采用掩码序列自编码器对神经网络模型进行预训练，以恢复随机掩码图像中丢失的像素点为目标。然后，在执行车道检测分割的微调分割阶段中，将连续图像帧用作输入，并且使用反向传播机制传输并进一步更新预训练的模型权重，其中定制的PolyLoss计算输出车道检测结果与标记的地面实况之间的加权误差。大量的实验结果表明，与所提出的管道，车道检测模型的性能在正常和具有挑战性的场景可以先进的超越国家的最先进的，提供最好的测试准确度（98.38%），精度（0.937），和F1-措施（0.924）的正常场景测试集，以及最好的整体准确度（98.36%）和精度（0.844）在具有挑战性的场景测试集，而训练时间可以大大缩短。

1.15 VoxDet: Voxel Learning for Novel Instance Detection

VoxDet：用于新实例检测的体素学习

论文地址：

https://arxiv.org/abs/2305.17220

基于多视图模板检测未见过的实例是一个具有挑战性的问题，由于其开放世界的性质。主要依赖于2D表示和匹配技术的传统方法往往不足以处理姿态变化和遮挡。为了解决这个问题，我们介绍了VoxDet，一个先锋的3D几何感知框架，充分利用强大的3D体素表示和可靠的体素匹配机制。VoxDet首次巧妙地提出模板体素聚合（TVA）模块，有效地将多视图2D图像转换为3D体素特征。通过利用相关联的相机姿态，这些特征被聚合成紧凑的3D模板体素。在新颖的实例检测中，该体素表示展示了对遮挡和姿势变化的增强的弹性。我们还发现，3D重建目标有助于预训练TVA中的2D-3D映射。其次，为了快速与模板体素对齐，VoxDet结合了查询体素匹配（QVM）模块。首先利用学习的2D-3D映射将2D查询转换成它们的体素表示。我们发现，由于3D体素表示编码的几何形状，我们可以首先估计相对旋转，然后比较对齐的体素，导致提高的准确性和效率。在苛刻的LineMod-Occlusion，YCB视频和新建成的RoboTools基准测试上进行了详尽的实验，其中VoxDet显著优于各种2D基线，召回率高20%，速度更快。据我们所知，VoxDet是第一个将隐式3D知识用于2D任务。

1.16 Building One-class Detector for Anything: Open-vocabulary Zero-shot OOD Detection Using Text-image Models

构建针对任何事物的单类检测器：使用文本-图像模型的开放词汇表Zero-ShotOOD检测

论文地址：

https://arxiv.org/abs/2305.17207

我们专注于深度学习模型中的分布外（OOD）检测的挑战，这是确保可靠性的一个关键方面。尽管付出了相当大的努力，但由于深度学习模型倾向于输出对OOD输入的过度自信预测，因此该问题在深度学习模型中仍然具有重大挑战性。我们提出了一种新的一类开放集OOD检测器，它利用文本图像预训练的模型在一个zero-shot的方式，并结合了各种描述的域和OOD。我们的方法旨在检测任何不在域中，并提供了灵活性，以检测各种各样的OOD，定义通过细粒度或粗粒度的标签，甚至在自然语言。我们评估我们的方法具有挑战性的基准，包括大规模的数据集包含细粒度，语义相似的类，分布移位图像，多对象图像包含混合的域和OOD对象。我们的方法在所有基准测试中显示出优于以前的方法的性能。代码可在www.example.com上获得。

【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
什么是RFM模型走过冬季学习笔记大数据数据分析
RFM模型是客户价值分析中一种经典且实用的量化模型，它通过三个关键维度评估用户价值，帮助企业识别最有价值的客户群体。名称RFM由三个核心指标的英文首字母组成：R（Recency）-最近一次消费时间定义：用户上一次发生交易行为距今的时间长度（如多少天前）。意义：衡量用户的活跃度和流失风险。R值越小（最近有消费），说明用户越活跃，流失风险越低；R值越大（很久没消费），用户流失风险越高。母婴场景示例：一
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
基于Python的Google Scholar学术论文爬虫实战：最新技术与完整代码解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言学习 scrapy
摘要本文详细介绍如何使用Python构建一个高效的GoogleScholar爬虫系统，包括代理设置、反反爬策略、数据解析与存储等核心技术。文章涵盖最新Python爬虫技术栈（如Playwright、异步IO等），提供完整可运行的代码示例，并讨论学术爬虫的伦理与法律问题。通过本教程，读者将掌握从GoogleScholar批量获取学术论文信息的高级爬虫技术。关键词：Python爬虫、GoogleSch
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
【C语言网络编程】HTTP 客户端请求（域名解析过程）
在做C语言网络编程或模拟HTTP客户端时，第一步就离不开“把域名解析为IP地址”这一步。很多人可能直接复制粘贴一段gethostbyname的代码，但未必真正理解它的原理。本篇博客将围绕一个经典函数：char*host_to_ip(constchar*hostname)深入剖析DNS解析过程、IP地址转换机制，并进一步带你了解HTTP请求是如何基于TCP通信进行的。一、核心函数：host_to_i
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
分布式选举算法＜一＞ Bully算法
分布式选举算法详解：Bully算法引言在分布式系统中，节点故障是不可避免的。当主节点（Leader）发生故障时，系统需要快速选举出新的主节点来保证服务的连续性。Bully算法是一种经典的分布式选举算法，以其简单高效的特点被广泛应用于各种分布式系统中。什么是Bully算法？Bully算法是一种基于优先级的分布式选举算法。每个节点都有一个唯一的ID，ID值越大的节点优先级越高。当主节点故障时，优先级最
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
Git 分支管理规范
一、大公司的分支管理实践1.GitFlow（经典模型）master：主分支，仅用于发布正式版本featureelop：开发分支，集成新功能feature/*：功能分支，从featureelop分支创建，用于开发新功能release/*：发布分支，从featureelop分支创建，用于测试和修复hotfix/*：热修复分支，从master分支创建，用于紧急修复2.GitHubFlow（持续交付型）m
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
2024年运维最新分布式存储ceph osd 常用操作_ceph查看osd对应硬盘(1)，2024年最新Linux运维编程基础教程 2401_83944328 程序员运维分布式 ceph
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递（5月30日论文合集）

文章目录

一、检测相关(16篇)

1.1 Contextual Object Detection with Multimodal Large Language Models

1.2 Towards minimizing efforts for Morphing Attacks – Deep embeddings for morphing pair selection and improved Morphing Attack Detection

1.3 Mining Negative Temporal Contexts For False Positive Suppression In Real-Time Ultrasound Lesion Detection

1.4 Pedestrian detection with high-resolution event camera

1.5 View-to-Label: Multi-View Consistency for Self-Supervised 3D Object Detection

1.6 CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion Models

1.7 T2FNorm: Extremely Simple Scaled Train-time Feature Normalization for OOD Detection

1.8 Real-time Object Detection: YOLOv1 Re-Implementation in PyTorch

1.9 Lighting and Rotation Invariant Real-time Vehicle Wheel Detector based on YOLOv5

1.10 Image Hash Minimization for Tamper Detection

1.11 k-NNN: Nearest Neighbors of Neighbors for Anomaly Detection

1.12 Deep Learning based Fingerprint Presentation Attack Detection: A Comprehensive Survey

1.13 FishEye8K: A Benchmark and Dataset for Fisheye Camera Object Detection

1.14 Robust Lane Detection through Self Pre-training with Masked Sequential Autoencoders and Fine-tuning with Customized PolyLoss

1.15 VoxDet: Voxel Learning for Novel Instance Detection

1.16 Building One-class Detector for Anything: Open-vocabulary Zero-shot OOD Detection Using Text-image Models

你可能感兴趣的:(目标检测经典论文导读,计算机视觉,计算机视觉,目标检测,人工智能)