飞大圣

基于互补激光雷达和雷达信号的雾天多模态车辆鲁棒检测

论文地址：Robust Multimodal Vehicle Detection in Foggy Weather Using Complementary Lidar and Radar Signals
论文代码：https://github.com/qiank10/MVDNet

论文摘要

使用激光雷达和摄像头等视觉传感器进行车辆检测是实现自动驾驶的关键功能之一。虽然它们在良好的天气条件下生成具有丰富信息的细粒度点云或高分辨率图像，但它们在恶劣天气（例如雾）中会失败，因为不透明颗粒会扭曲光线并显着降低能见度。因此，依赖激光雷达或摄像头的现有方法在罕见但关键的恶劣天气条件下会出现显着的性能下降。为了解决这个问题，论文采用互补雷达，这种雷达受恶劣天气的影响较小，并且在车辆上普遍使用。
在论文中，提出了多模态车辆检测网络（MVDNet），这是一种两级深度融合检测器，它首先从两个传感器生成 proposal ，然后融合多模态传感器流之间的区域特征以改善最终检测结果。

论文背景

如今，自动驾驶车辆配备了多种传感器模式，例如摄像头、激光雷达和雷达。融合多模态传感器可以克服任何单个传感器的偶尔故障，并且可能比仅使用单个传感器产生更准确的物体检测。现有的物体检测器主要融合了激光雷达和摄像头，它们通常提供丰富且冗余的视觉信息。然而，这些视觉传感器对天气条件很敏感，在雾等恶劣天气下无法充分工作，使得自主感知系统不可靠。

图 a 显示了带有标记的真实车辆的驾驶场景示例。图 b 显示了仅使用因雾而恶化的激光雷达点云检测到的车辆。由于雾的遮挡，顶部最远的两辆车失踪了。

除了激光雷达和摄像头之外，雷达已广泛部署在自动驾驶汽车上，并且具有克服雾天的潜力。具体来说，雷达使用毫米波信号，其波长远大于形成雾、雨和雪的微小颗粒，因此很容易穿透或衍射它们周围。
然而，现有自动驾驶数据集中的雷达仍未得到充分研究，主要是由于与摄像头和激光雷达相比，其数据稀疏。

例如，nuScenes 数据集大约有 35K 个激光雷达点，但每个数据帧中平均只有 200 个雷达点。主要原因是其雷达采用传统的电子可控天线阵列，往往会产生宽波束宽度（3.2°-12.3°）的波束方向图。在 DENSE 数据集中，专有雷达安装在车辆的前保险杠上，然而，其视场角仅为35°。幸运的是，最近的牛津雷达机器人汽车（ORR）部署了带有旋转喇叭天线的雷达，该天线具有高方向性和更精细的空间分辨率（0.9°），并通过机械旋转实现360°视场。

ORR 雷达生成密集的强度图，如图 c 所示，其中每个像素代表反射信号强度。它为雾天条件下的物体检测创造了新的机会。

尽管信息更丰富，ORR 雷达仍然比其视觉对应物（即激光雷达）更粗糙且噪声更大，如图 a 和 c 所示。因此，如果以与激光雷达点云相同的方式处理它，就会出现误报和较大的回归误差。为了在雾天可靠地检测车辆，应该利用激光雷达（可见范围内的细粒度）和雷达（不受雾天影响）的优点，同时克服它们的缺点。

为此，论文提出了 MVDNet，一种用于恶劣雾天条件下车辆检测的多模态深度融合模型。
MVDNet 由两个阶段组成。第一阶段分别从激光雷达和雷达生成proposal。第二阶段通过注意力对两个传感器的特征进行自适应融合，并使用 3D 卷积进行时间融合。这种后期融合方案允许模型生成足够的建议，同时将融合集中在感兴趣区域 (ROI) 内。
如图d所示，MVDNet 不仅可以检测激光雷达点云中被雾遮挡的车辆，还可以拒绝噪声雷达强度图中的误报。

为了验证 MVDNet，我们根据 ORR 的原始激光雷达和雷达信号创建了一个程序生成的训练数据集。具体来说，我们在激光雷达点云中手动生成车辆的定向边界框，利用视觉里程计知识同步雷达和激光雷达，并使用 DEF 中提出的精确雾模型模拟随机雾效果。我们将 MVDNet 与最先进的单独激光雷达探测器或激光雷达和雷达融合 [3] 进行比较。评估结果表明，MVDNet 在雾天条件下的车辆检测方面取得了明显更好的性能，同时所需的计算资源减少了 10 倍。

论文贡献

1.提出了一种深度后期融合探测器，可以有效地利用激光雷达和雷达的互补优势。MVDNet 代表了第一个融合激光雷达和高分辨率 360° 雷达信号进行车辆检测的车辆检测系统。
2.引入了雾天气条件下具有细粒度激光雷达和雷达点云的标记数据集。在所提出的数据集上评估 MVDNet 并证明所提出的融合模型的有效性。

论文相关

根据激光雷达信号进行车辆检测。根据点云的表示，基于激光雷达的目标检测分为两类。
一方面，激光雷达数据默认形式化为点云，可以通过为无序点集设计的架构自然地处理、。基于这些架构，可以实现原始点云的端到端学习。 PointRCNN 使用 PointNet 提取逐点特征，并结合不同阶段的特征来识别前景。然后它会生成建议并完善最终的检测结果。PointPillars 将点分割成柱子，其中使用 PointNet 计算柱状特征以形成伪图像。然后图像被传递到 CNN 主干和 SS 检测头。然而，对于被恶劣天气遮挡的区域，由于那里没有任何点，因此无法学习逐点特征。
另一方面，激光雷达点云可以通过标准图像检测模型进行体素化和处理。 PIXOR 对点进行分割并生成不同高度的占用图。体素表示可以轻松地与其他常规图像数据（例如来自相机和激光雷达的图像数据）组合，并在 MVDNet 中得到利用。

由于对比度的损失和可见范围的减少，雾和霾会降低相机和激光雷达等视觉传感器的数据质量。一方面，人们提出了复杂的图像去雾方法以有利于学习任务。这些方法要么使用手工制作的或学习的先验来估计有雾和清晰图像之间的传输图，要么开发端到端的可训练模型。另一方面，关于激光雷达点云去噪的研究很少。由于激光雷达点云的稀疏性，现有的密集3D点云去噪方法不能直接应用于去除雾点。 DROR 利用点的动态空间邻近进行去噪。由于缺乏语义信息，它可能会错误地删除对象的孤立反射。现有的去噪方法无法在没有额外信息的情况下补偿由于雾导致的激光雷达能见度的降低。相比之下，MVDNet 使用高分辨率雷达来对抗雾天，以补充对天气敏感的激光雷达点云。

通过传感器融合进行车辆检测。多模态传感器提供冗余信息，使其能够抵御由于内部噪声和恶劣天气而导致的传感器失真。大多数融合方法都是针对激光雷达和相机提出的，因为它们在公共数据集中可用。 MV3D聚合了多个视图的提案。 PointFusion结合激光雷达和相机的特征向量来预测车辆的 3D 边界框。
雷达作为自主感知的附加方式最近越来越受到关注， DEF开发了一种带有激光雷达、摄像头和雷达的早期融合探测器。但DEF的雷达质量较低，导致雷达单独工作时性能较差。此外，DEF的雷达和摄像头视角较窄，探测器是专门为前视设计的，适应360°探测并非易事。 RadarNet在早期特征提取阶段通过 CNN 融合稀疏雷达点和激光雷达点云，以检测 360° 视角中的物体，并进一步将稀疏雷达点与检测结果关联起来以完善运动预测。 LiRaNet 还在早期阶段将稀疏雷达点与激光雷达点云和道路图融合，以预测检测到的车辆的轨迹。
相比之下，MVDNet 的目标是在雾天条件下进行稳健的车辆检测。为了实现这一目标，论文利用了最先进的成像雷达，其分辨率比 RadarNet 和 LiRaNet 中使用的分辨率要高得多，并提出了一种有效的深度后期融合方法来组合雷达和激光雷达信号。

论文内容

问题建模

(a) 不受雾影响的同步雷达强度图；(b) 32 m 以内截断的原始点云；© 具有散射雾点（红色）且可见范围缩小的雾点云。
雾的不利影响已得到很好的测量和建模。上图举例说明了效果，其中使用 [雾模型（雾密度为 0.05 m−）对来自 ORR 激光雷达（Velodyne HDL-32E 激光雷达）的点云进行雾化。
1.由于其透射率低于晴朗空气，雾会在两个方面扭曲激光雷达点云：
（i）远处物体反射的激光被衰减，变得太弱而无法被激光雷达捕获，导致可见范围缩小。
（ii) 不透明雾反向散射激光信号，导致散射雾点（图 c 中的红点）。
这些不利影响可能会导致误报和误检测，如图 1b 所示。相比之下，雾对雷达来说几乎是透明的 [14, 1]。但由于其信号波长较长且波束宽度较宽，雷达本质上比激光雷达具有较低的空间分辨率。因此，迄今为止，雷达主要用于运动/速度跟踪。

新兴的成像雷达，例如 ORR 中使用的 NavTech CTS350-X ，可以实现具有与低级激光雷达相当的分辨率和密度的点云。例如，图 a 显示了 ORR 雷达的鸟瞰强度图示例。突出的强度峰值对应于道路上的主要物体（例如车辆、墙壁等），并且与激光雷达对应物很好地匹配。

MVDNet 本质上将雷达强度图与激光雷达点云深度融合，以利用它们的互补功能。如图所示，MVDNet 由两个阶段组成。区域提议网络（MVD-RPN）从激光雷达和雷达输入中提取特征图，并从中生成提议。区域融合网络（MVD-RFN）池化并融合两个传感器帧的区域特征，并输出检测到的车辆的面向边界框。

MVD-RPN BackBone

特征提取器

MVDNet 使用两个具有相同结构的特征提取器来处理激光雷达和雷达输入。但由于更多的激光雷达输入通道，激光雷达部分的特征通道数量增加了一倍。

如图 a 所示，特征提取器首先使用 4 个3×3卷积层以输入分辨率提取特征。然后，它通过最大池化将输出下采样 2 倍，并进一步以较粗的分辨率提取特征。
从鸟瞰角度来看，车辆只占据很小的区域。具体来说，ORR中的车辆平均尺寸为 2.5 m×5.1 m，仅占据 13×26 像素区域，输入分辨率为 0.2 m。对鸟瞰图进行下采样使得区域特征容易在后续提案生成器中受到量化误差的影响。
因此，MVDNet 通过转置卷积层对粗粒度特征图进行上采样，并通过跳跃链接将输出与细粒度特征图连接起来。每个特征提取器应用于相应传感器的所有 $H$ 个输入帧并生成一组 $H$ 个特征图。

提案生成器

如图（b），提案生成器将 $H$ 个特征图流作为输入，并稍后生成 MVD-RFN 的建议。
由于移动车辆在不同的传感器帧中处于不同的位置，MVDNet 不是从每个帧的特征图单独生成建议，而是连接每个传感器的所有帧的特征图，并通过卷积层融合它们。为了充分利用各个传感器，每个传感器的融合特征图被单独使用来推断客观性分数并回归具有 K 个预定义锚点的提案位置。最后，两个传感器生成的建议通过非极大值抑制（NMS）进行合并。

MVD-RFN Multimodal Fusion

MVD-RPN 生成的提案在 RoI 池化器中用于创建区域特征。对于每个提案，池化操作应用于每个帧和传感器的特征图中的区域，产生 $2 H C \times W \times L$ 特征张量，其中 $C$ 是特征图中的通道数， $W \times L$ 是 2D 池化尺寸。然后，MVDNet 通过两个步骤融合每个提案的特征张量，即传感器融合和时间融合，如图 c 所示。

传感器融合

传感器融合融合了同步激光雷达和雷达帧对的特征张量。直观上，激光雷达和雷达并不总是同等重要，应相应地权衡它们的贡献。例如，完全被雾遮挡的车辆返回零激光雷达点，因此激光雷达的特征张量的权重应该较小。相反，雷达强度图中某些背景区域的强峰值可能类似于车辆的强度峰值。在这种情况下，应利用激光雷达特征的提示来减轻该区域周围的雷达特征的权重。
MVDNet 通过扩展注意力块来自适应地融合激光雷达和雷达特征。它将展平的特征张量 ${\text x}_{in}$ 作为输入，计算两个 embeding 空间 $θ$ 和 $φ$ 之间的相似度，并使用相似度为第三个嵌入空间 $g$ 创建注意力图，以生成残差输出，即
$\tag1 \text{x}_{out}=\sigma((\boldsymbol W_{\theta} \text x_{in})^T\boldsymbol W_{\phi} \text x_{in})\boldsymbol W_{g} \text x_{in} + \text x_{in}$

其中 $\boldsymbol W_{\theta}, \boldsymbol W_{\phi}, \boldsymbol W_{\phi}$ 分别是到嵌入空间 $θ$ 、 $φ$ 、 $g$ 的线性变换， $σ$ 表示 softmax 函数。

如图 c 所示，传感器融合的每个分支都由两个注意力块组成。虽然自注意力在各个传感器内应用注意力，但交叉注意力在对应传感器的指导下进一步应用注意力。具体来说，对于任一传感器 $s_0 \in \{lidar，radar \}$ 及其对应传感器 $s_1$ ：
$\tag2 \text {x}_{s_0}^{'} = \sigma((\boldsymbol W_{\theta} \text x_{s_1}^{'})^T\boldsymbol W_{\phi} \text x_{s_1}^{'})\boldsymbol W_{g} \text x_{s_0}^{'} + \text x_{s_0}^{'}$

其中 $\text x^{'}$ 表示每个分支的自注意力输出的特征向量。来自两个传感器交叉注意力的输出特征向量被重塑回特征张量并连接以进行时间融合。

时间融合

时间融合进一步合并不同帧的参与特征张量。
如图 c 所示，MVDNet 没有使用时序和内存密集型循环结构，而是沿新维度连接不同帧的参与特征张量以形成 4D 特征张量，并应用 3D 卷积层以允许沿时间维度交换信息。最后一个卷积层压缩时间维度并输出融合的特征张量。然后，MVDNet 展平融合的特征张量并将其传递到全连接层以推断最终检测的客观分数和回归位置，如图 d 所示。

论文总结

论文引入了 MVDNet，以便在恶劣的雾天条件下实现车辆检测。 MVDNet 通过传感模式和时间维度的深度后期融合，利用激光雷达和雷达的互补优势。为了评估 MVDNet，引入了一种新颖的程序生成训练数据集，其中包含空间细粒度机械雷达和激光雷达。实验结果表明，与现有的单独激光雷达或多模态方法相比，MVDNet 始终保持较高的检测精度，尤其是在雾天条件下。

COCO8 数据集上训练 YOLO11n：从入门到跑路（100 轮训练实战）星际编程喵 Python探索之旅目标跟踪人工智能计算机视觉机器学习
前言训练YOLO11n，听起来就像是给赛博世界的“战斗天使”装上双核发动机，而COCO8数据集，则是那个小小的试验场。今天，我们就要在这个数据集上训练YOLO11n模型100轮，见证它如何从一个懵懂的“AI萌新”成长为“目标检测大佬”。本篇文章将以专业又幽默的方式，带你深入了解训练流程，并提供完整代码示例，让你轻松掌握这项技术。简介YOLO（YouOnlyLookOnce）是目标检测领域的明星模型
【SLAM】SLAM技术详解：同步定位与地图构建 steamedobun 计算机视觉 SLAM 深度学习人工智能目标检测机器学习
引言在机器人技术、自动驾驶、增强现实（AR）和无人机等前沿领域，SLAM（SimultaneousLocalizationandMapping）技术扮演着至关重要的角色。SLAM，即同时定位与地图构建，是一种通过传感器数据实时估计机器人或无人系统自身位置并构建环境地图的技术。本文将详细介绍SLAM技术的原理、应用场景、分类及其优缺点，并对SLAM技术的未来发展进行展望。SLAM技术概述定义与原理S
VS2019+QT4.15+openCV4.5.1+CUDA加速小小秀峰哥 python 人工智能深度学习
文章目录前言一、软件安转以及注意事项二、CMake编译总结前言`最近公司有一个关于使用海康威视网络摄像头的目标检测的项目，发现使用openCV显示时，出现很大的延时，因此，只能使用cuda进行加速才能使显示达到实时，在进行编译时我发现很多问题，解决了好几天才完成编译一、软件安转以及注意事项1、Windows10系统2、VisualStudio2019与QT4.15（先安装）3、CUDA11.8、c
如何使用深度学习中的 Transformer 算法进行视频目标检测 go5463158465 python 算法深度学习 python 开发语言
以下将介绍如何使用深度学习中的Transformer算法进行视频目标检测，并给出一个复现相关论文思路及示例代码。这里以DETR（End-to-EndObjectDetectionwithTransformers）为基础进行说明，它是将Transformer引入目标检测领域的经典论文。步骤概述环境准备：安装必要的库，如PyTorch、torchvision等。数据准备：使用公开的视频目标检测数据集，
SpringBoot中运行Yolov5程序 eqa11 spring boot YOLO 后端
文章目录SpringBoot中运行Yolov5程序一、引言二、环境搭建1、SpringBoot项目创建2、YOLOv5环境配置三、SpringBoot与YOLOv5集成1、创建Python服务2、SpringBoot调用Python服务四、使用示例1、创建控制器五、总结SpringBoot中运行Yolov5程序一、引言在人工智能领域，目标检测是一个热门且实用的技术。YOLOv5作为目标检测算法中的
计算机视觉：解锁未来智能的钥匙及其代码实践我的运维人生计算机视觉人工智能运维开发技术共享
计算机视觉：解锁未来智能的钥匙及其代码实践在当今这个数据爆炸的时代，计算机视觉作为人工智能的一个重要分支，正以前所未有的速度推动着科技的边界。它不仅让机器“看懂”世界，更在自动驾驶、医疗影像分析、智能制造、安防监控等众多领域展现出巨大的应用潜力。本文将深入探讨计算机视觉的核心技术、最新进展，并通过一个具体的代码案例，展示如何在实践中应用这些技术，旨在为读者提供一个理论与实践相结合的全面视角。一、计
自动驾驶（Automated Driving）系统组成和主要技术--以思维导图形式介绍大连海事的亲外甥自动驾驶人工智能机器学习
一、自动驾驶概念介绍自动驾驶是指汽车依靠传感器、高精度地图和复杂的算法等，不需要驾驶员操作而自动完成驾驶的技术。二、自动驾驶系统组成和主要技术架构图思维导图形式绘制1、感知层传感器模块:包括摄像头、激光雷达、毫米波雷达和超声波雷达等，用于获取车辆周围环境的数据，如道路状况、其他车辆、行人和障碍物等。定位传感器模块:包括GNSS(全球导航卫星系统)、INS(惯性导航系统)和视觉SLAM等，用于确定车
YOLO 目标检测编程详解不知名靓仔 YOLO 目标检测人工智能
引言目标检测是计算机视觉中的一个重要任务，它旨在识别图像中的对象并定位这些对象的位置。YOLO（YouOnlyLookOnce）是一种流行的目标检测算法，因其速度快且准确度高而广受好评。本文将深入探讨YOLO的原理及其实现方法，并提供一个使用Python和PyTorch的示例代码。项目源码见最下方1.YOLO算法简介YOLO算法的核心思想是将目标检测视为回归问题，而不是传统的分类加定位的两阶段方法
Python实现YOLO目标检测我专门写bug PYTHON python YOLO 目标检测
#-*-coding:utf-8-*-#载入所需库importcv2importnumpyasnpimportosimporttimedefyolo_detect(pathIn='',pathOut=None,confidence_thre=0.5,nms_thre=0.3,jpg_quality=80):#pathIn：原始图片的路径#pathOut：结果图片的路径#label_path：类别标
【yolo目标检测】交通标志检测鱼弦【HOT】技术热谈 YOLO 目标检测人工智能
鱼弦：CSDN内容合伙人、CSDN新星导师、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）YOLO（YouOnlyLookOnce）是一种流行的实时目标检测算法，可用于交通标志检测。以下是关于YOLO目标检测的原理详细解释、使用场景解释以及相关文献材料的链接：原理详细解释：YOLO目标检测
【YOLOv11改进- 主干网络】YOLOv11+MobileNetV2（2018）: 相比于 MobileNetV1 而言准确率更高，模型更小；算法conv_er YOLOv11目标检测改进 YOLO 网络 cnn 深度学习机器学习目标检测人工智能
YOLOV11目标检测-主干网络改进实例与创新改进专栏目录YOLOV11目标检测-主干网络改进实例与创新改进专栏本文介绍1.完整代码获取2.MobileNetv2介绍摘要亮点优势3.MobileNetv2网络结构图4.yolov11-MobileNetv2yaml文件5.MobileNetv2代码实现6.MobileNetv2添加方式论文地址：MobileNetV2:InvertedResidua
【YOLOv11改进- 主干网络】YOLOv11+TransNext特征提取网络（CVPR2024）: 基于YOLOv11的主干网络改进超轻量；算法conv_er YOLOv11目标检测改进 YOLO 网络人工智能深度学习机器学习目标检测
YOLOV11目标检测-主干网络改进实例与创新改进专栏目录YOLOV11目标检测-主干网络改进实例与创新改进专栏本文介绍1.完整代码获取2.TransNext介绍摘要亮点优势3.TransNext网络结构图4.yolov11-transNextyaml文件5.TransNext代码实现6.TransNext添加方式论文地址：http://arxiv.org/pdf/2311.17132http:/
【YOLOv11改进- 注意力机制】YOLOv11+SCSA注意力机制（2024）: 最新空间和通道协同注意力,助力YOLOv11有效涨点；包含二次创新算法conv_er YOLOv11目标检测改进 YOLO 深度学习人工智能目标检测计算机视觉机器学习
YOLOV11目标检测改进实例与创新改进专栏专栏地址：YOLOv11目标检测改进专栏，包括backbone、neck、loss、分配策略、组合改进、原创改进等；本文介绍本文给大家带来的改进内容是在YOLOv11中添加SCSA注意力机制，助力有效涨点。作者提出了一种新的空间与通道协同注意模块（SCSA），该模块涉及在多个语义层面上对空间注意力和通道注意力之间协同关系的研究。SCSA由两部分组成：可共
【计算机视觉】目标跟踪应用油泼辣子多加计算机视觉计算机视觉目标跟踪人工智能
一、简介目标跟踪是指根据目标物体在视频当前帧图像中的位置，估计其在下一帧图像中的位置。视频帧由t到t+1的检测，虽然也可以使用目标检测获取，但实际应用中往往是不可行的，原因如下：目标跟踪的目的是根据目标在当前视频帧图像中的位置，预测其在下一帧图像中的位置。然而，使用目标检测直接获取目标位置的方式在实际应用中存在一些限制，主要原因如下：1.实时性问题频繁检测开销大：目标检测通常需要对每一帧的整个图像
《深度剖析Q-learning中的Q值：解锁智能决策的密码》人工智能深度学习
在人工智能的飞速发展进程中，强化学习作为一个关键领域，为智能体与环境交互并学习最优行为策略提供了有效框架。其中，Q-learning算法凭借其独特的魅力，在机器人控制、自动驾驶、游戏AI等众多领域大放异彩。而Q-learning中的Q值，更是理解这一算法的核心关键，它如同智能体的“智慧密码”，指导着智能体在复杂环境中做出最优决策。Q值的直观定义：行为价值的“预言家”从直观层面理解，Q值代表着智能体
ROS中可视化车辆运动路径-采用RVIZ进行显示 m0_46699649 人工智能算法 c++自动驾驶
一：序言在进行机器人自动驾驶过程中数据分析必不可少，为了更方便我们进行处理和观看这个功能效果，进行可视化是必不可少的，车辆行驶路径往往是以路径点的信息进行保存，为了更直观看到显示的效果，可以将其在RVIZ上可视化出来。如果觉得学习了C++和ROS不知道怎么入手自动驾驶项目的可以参考这个项目，或者C++和ROS不是很熟练的我也推荐结合相关课程一块学习无人车采用纯跟踪算法跟随离线路径（ROS，C++实
单目测距（yolo-目标检测+标定+深度学习目标检测_测距）计算机C9硕士_算法工程师 YOLO 目标检测深度学习
YOLOv5模型介绍YOLOv5是目前最先进的目标检测算法之一，在多个数据集上取得了优秀的表现。相较于YOLOv4，YOLOv5采用了更深的Backbone网络和更高的分辨率输入图像，以提高检测精度和速度。单目测距实现方法在目标检测的基础上，我们可以通过计算物体在图像中的像素大小来估计其距离。具体方法是，首先确定某个物体的实际尺寸，然后根据该物体在图像中的像素大小计算其距离。这个方法可以应用于各种
SalFAU-Net:显著性目标检测的显著性融合注意U-Net 明初啥都能学会目标检测人工智能计算机视觉
SalFAU-Net:显著性目标检测的显著性融合注意U-Net摘要IntroductionRelatedWorksSalFAU-Net:SaliencyFusionAttentionU-NetforSalientObjectDetection摘要显著目标检测（SOD）在计算机视觉中仍然是一个重要的任务，其应用范围从图像分割到自动驾驶。基于全卷积网络（FCN）的方法在过去几十年里在视觉显著性检测方面
基于深度学习的遥感目标检测系统：UI界面、R-CNN模型与数据集准备 2025年数学建模美赛 R-CNN检测系统人工智能深度学习 r语言 cnn python ui 目标检测
一、引言遥感图像中的目标检测在很多领域，如环境监测、土地利用、城市规划、农业资源监测等方面有着广泛应用。遥感图像具有高分辨率和丰富的空间信息，但同时也带来了目标检测中的许多挑战，特别是在目标尺度变化、遮挡和复杂背景的情况下。因此，采用深度学习技术，尤其是卷积神经网络（CNN）和区域卷积神经网络（R-CNN），在遥感图像目标检测中取得了显著的成果。本文将详细介绍基于深度学习的遥感目标检测系统，使用R
ultralytics 是什么？博刻 AI 学习笔记 python
ultralytics是一个用于计算机视觉任务的Python库，专注于提供高效、易用的目标检测、实例分割和图像分类工具。它最著名的功能是实现YOLO（YouOnlyLookOnce）系列模型，特别是最新的YOLOv8。1.YOLO是什么？YOLO是一种流行的目标检测算法，以其速度快和精度高而闻名。YOLO的核心思想是将目标检测问题转化为一个回归问题，直接预测目标的边界框和类别。YOLOv8是YOL
json格式的标记文件转yolo格式（txt）的标记文件帅气的亮 json YOLO python
背景我在使用anylabeling标记软件时发现导出的标记文件格式只能是json格式，而我yolov8训练模型的标记文件需要时txt格式的，所以我需要写一个转换脚本脚本1.脚本1这个脚本是针对于矩形框标记的转换，也就是目标检测importjsonimportosdefconvert_json_to_yolo(json_file_path,output_dir,class_mapping):"""将
基于R-CNN深度学习的无人机目标检测系统：数据集、模型和UI界面的完整实现 2025年数学建模美赛 R-CNN检测系统深度学习 cnn 无人机计算机视觉目标检测人工智能
摘要随着无人机技术的迅猛发展，无人机在军事、农业、环境监测等多个领域的应用日益广泛。无人机目标检测系统的建设成为提升无人机自主飞行和环境感知能力的重要环节。本文将详细介绍如何构建一个基于深度学习的无人机目标检测系统，采用R-CNN（区域卷积神经网络）算法，通过用户界面设计和数据集处理，实现高效的目标检测功能。通过本项目，旨在为无人机目标检测提供一种可行的解决方案，并提高其在复杂环境下的工作效率。目
基于YOLOv8+PyQt5的密集人群计数检测系统人工智能教学实践 YOLO qt 目标检测
基于YOLOv8+PyQt5的密集人群计数检测系统是一个结合了目标检测算法与图形用户界面的项目，以下是相关介绍：【毕业设计参考】基于yolov8+pyqt5的密集人群计数检测系统.zip资源-CSDN文库系统概述该系统旨在实时分析某一区域内的人群数量与分布情况，将YOLOv8算法的高效目标检测能力与PyQt5框架的简洁直观界面相结合，能够实时捕获视频流，通过YOLOv8进行人群检测，并在用户界面中
YOLOv9改进，YOLOv9检测头融合ASFF（自适应空间特征融合），全网首发挂科边缘 YOLOv9改进 YOLO 目标检测人工智能深度学习计算机视觉
摘要一种新颖的数据驱动的金字塔特征融合策略，称为自适应空间特征融合（ASFF）。它学习了在空间上过滤冲突信息以抑制不一致的方法，从而提高了特征的尺度不变性，并引入了几乎免费的推理开销。#理论介绍目标检测在处理不同尺度的目标时，常采用特征金字塔结构。然而，这种金字塔结构在单步检测器中存在尺度不一致性问题，即不同尺度的特征层在检测过程中可能产生冲突，导致精度下降。ASFF方法通过学习每个尺度特征的自适
深度学习之基于Django+YOLOv5商标识别 Q1744828575 python plotly python
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景在数字化时代，商标作为企业的重要资产，其保护和管理显得尤为重要。然而，传统的商标识别方法往往依赖于人工审查，效率低下且容易出错。随着深度学习技术的不断发展，尤其是目标检测领域的进步，自动化、高精度的商标识别成为可能。本项目旨在利用DjangoWeb框架和YOLO
SOAFEE 技术研讨会：汽车软件定义与自动驾驶技术探讨老猿讲编程汽车自动驾驶人工智能
在本次技术研讨会上，来自汽车与科技领域的专家们围绕汽车软件定义及自动驾驶技术展开了深入交流与探讨。从SOAFEE蓝图计划的创新性理念，到Autoware开源项目及OpenADKit在实际应用中的探索，再到EdgeWorkloadAbstractionandOrchestrationLayer（EWAOL）的技术落地，为汽车行业迈向智能化、软件定义化的未来提供了宝贵的思路与方向。SOAFEE蓝图介绍
YOLOv8改进策略【Backbone/主干网络】| CVPR 2024替换骨干网络为 UniRepLKNet，解决大核 ConvNets 难题 Limiiiing YOLOv8改进专栏 YOLO 网络目标检测深度学习计算机视觉
一、本文介绍本文记录的是基于UniRepLKNet的YOLOv8骨干网络改进方法研究。UniRepLKNet提出了独特的大核设计能有效捕捉图像特征，在多模态任务中展现出强大的通用感知能力。将UniRepLKNet应用到YOLOv8的骨干网络中，提升YOLOv8在目标检测任务中的精度和效率。本文在YOLOv8的基础上配置了原论文中unireplknet_a,unireplknet_f,unirepl
基于 PyTorch 的深度学习模型开发实战一ge科研小菜鸡人工智能深度学习
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言深度学习已广泛应用于图像识别、自然语言处理、自动驾驶等领域，凭借其强大的特征学习能力，成为人工智能的核心技术之一。PyTorch作为当前流行的深度学习框架，提供了灵活的张量操作和动态计算图，便于模型的快速开发和调试。本教程将通过一个完整的深度学习模型开发流程，从数据预处理、模型构建、训练与优化、评估以及部署，帮助读者深入理解深度学习的关键技术
计算机视觉目标检测-DETR网络 next_travel 计算机视觉目标检测人工智能
目录摘要abstractDETR目标检测网络详解二分图匹配和损失函数DETR总结总结摘要DETR（DEtectionTRansformer）是由FacebookAI提出的一种基于Transformer架构的端到端目标检测方法。它通过将目标检测建模为集合预测问题，摒弃了锚框设计和非极大值抑制（NMS）等复杂后处理步骤。DETR使用卷积神经网络提取图像特征，并将其通过位置编码转换为输入序列，送入Tra
使用YOLOv8训练一个无人机（UAV）检测模型，深度学习目标检测中_并开发一个完整的系统 yolov8来训练无人机数据集并检测无人机 QQ_1309399183 无人机类 YOLO 无人机深度学习
使用YOLOv8训练一个无人机（UAV）检测模型，深度学习目标检测中_并开发一个完整的系统yolov8来训练无人机数据集并检测无人机无人机数据集，yolo格式种类为uav，一共近5w张图片，如何用yolov8代码训练无人机检测数据集文章目录以下文章及内容仅供参考。1.环境部署2.数据预处理数据集准备划分数据集3.模型定义4.训练模型5.评估模型6.结果分析与可视化7.集成与部署PyQt6GUI(`
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修