EchoRouRou

＜论文阅读＞DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection

文章目录

摘要
1.引言
2.相关工作
3.DeepFusion
- 3.1深度特征融合方案
- 3.2.对齐质量的影响
- 3.3. 提高对齐质量
4.实验
5.总结

摘要

激光雷达和摄像头是为自动驾驶中的 3D 检测提供补充信息的关键传感器。虽然流行的多模态方法 [34, 36] 只是简单地用相机特征装饰原始激光雷达点云并将它们直接输入到现有的 3D 检测模型中，但我们的研究表明，融合相机特征与深度激光雷达特征而不是原始激光雷达特征点，可以带来更好的性能。然而，由于这些特征经常被增强和聚合，融合的一个关键挑战是如何有效地对齐来自两种模态的转换特征。在本文中，我们提出了两种新技术：InverseAug 逆几何相关增强，例如旋转，以实现激光雷达点和图像像素之间的精确几何对齐，以及利用交叉注意力动态捕获相关性的 LearnableAlign融合过程中图像和激光雷达特征之间的关系。基于 InverseAug 和 LearnableAlign，我们开发了一个名为 DeepFusion 的通用多模态 3D 检测模型系列，比以前的方法更准确。例如，DeepFusion 分别在 6.7、8.9 和 6.2 LEVEL 2 APH 的行人检测中改进了 PointPillars、CenterPoint 和 3D-MAN 基线。值得注意的是，我们的模型在 Waymo 开放数据集上实现了最先进的性能，并显示出强大的模型对输入损坏和分布外数据的鲁棒性。

1.引言

激光雷达和摄像头是用于自动驾驶的两种互补传感器。对于 3D 物体检测，激光雷达提供低分辨率的形状和深度信息，而相机提供高分辨率的形状和纹理信息。虽然人们期望这两种传感器的组合能够提供最好的 3D 物体检测器，但事实证明，大多数最先进的 3D 物体检测器仅使用激光雷达作为输入（Waymo Challenge 排行榜，2021 年 10 月 14 日访问）。这表明如何有效融合来自这两个传感器的信号仍然具有挑战性。在本文中，我们努力为这个问题提供一个通用且有效的解决方案。文献中用于融合激光雷达和相机的现有方法大致遵循两种方法（图 1）：它们要么在早期阶段融合特征，例如通过用相应的相机特征装饰激光雷达点云中的点 [34， 36]，或者他们使用中级融合，在特征提取后组合特征[13, 17]。这两种方法的最大挑战之一是找出激光雷达和摄像头特征之间的对应关系。为了解决这个问题，我们提出了两种方法：InverseAug 和 LearnableAlign 来实现有效的中级融合。 InverseAug 反转与几何相关的数据增强（例如，RandomRotation [46]），然后使用原始相机和激光雷达参数来关联两种模态。 LearnableAlign利用交叉注意力来动态学习激光雷达特征与其相应相机特征之间的相关性。这两种提议的技术简单、通用且高效。给定流行的 3D 点云检测框架，例如 Point Pillars [16] 和 CenterPoint [44]，InverseAug 和 LearnableAlign 可帮助相机图像有效地与激光雷达点云对齐，同时具有边际计算成本（即，仅一个交叉注意力层）。在融合对齐的多模态特征时，相机信号具有更高的分辨率，显着提高了模型的识别和定位能力。这些优点对于远程目标检测特别有益。

图 1. 我们的方法在深度特征级别融合了两种模式，而之前最先进的方法（PointPainting [34] 和 PointAugmenting [36] 作为示例）在输入级别使用相机特征装饰激光雷达点。为了解决深度特征融合的模态对齐问题（参见第 1 节），我们提出了两种技术 InverseAug（参见图 2 和图 3）和LearnableAlign，一种基于交叉注意的特征级对齐技术。
我们开发了一系列名为 DeepFusions 的多模态 3D 检测模型，它们具有以下优势：(1) 可以进行端到端训练，(2) 是与许多现有的基于体素的通用构建块兼容 3D检测方法。 DeepFusion 作为一个插件，可以轻松应用于大多数基于体素的 3D 检测方法，例如 PointPillars [16] 和 CenterPoint [44]。
我们广泛的实验表明（1）有效的深度特征对齐是多模态 3D 对象检测的关键，（2）通过使用我们提出的 InverseAug 和 LearnableAlign 提高对齐质量，DeepFusion 显着提高了检测精度，并且（3) 与其单模态基线相比，DeepFusion 对输入损坏和分布外数据的鲁棒性更强。
在 Waymo 开放数据集上，DeepFusion 将 PointPillars [16]、CenterPoints [44] 和 3D-MAN [43] 等几种流行的 3D 检测模型分别提高了 6.7、8.9 和 6.2 LEVEL 2 APH。我们在 Waymo Open Dataset 上取得了最先进的结果，DeepFusion 在验证集上比之前最好的多模态方法 PointAugmenting [36] 提高了 7.4 Pedestrian LEVEL 2 APH。这一结果表明，我们的方法能够有效地结合激光雷达和相机模式，其中最大的改进来自远程物体的识别和定位。
我们的贡献可以概括为三个方面：

据我们所知，我们是第一个系统研究深度特征对齐对 3D 多模态检测器的影响的人；
我们提出 InverseAug 和 LearnableAlign 来实现深度特征级别的对齐，从而实现准确且稳健的 3D 对象检测器；
我们提出的模型 DeepFusions 在 Waymo 开放数据集上实现了最先进的性能。

2.相关工作

点云上的 3D 对象检测。激光雷达点云通常表示为无序集，许多 3D 对象检测方法倾向于直接处理这种原始无序点。 PointNet [25] 和 PointNet++ [26] 是直接将神经网络应用于点云的早期开创性作品。紧随其后，[22,24,31,42] 也学习了类似 PointNet 的 [25] 层的特征。激光雷达点云也可以表示为密集范围图像，其中每个像素都包含额外的深度信息。[1, 18] 直接在范围图像上工作以预测 3D 边界框。
另一组 3D 检测方法将激光雷达点转换为体素或柱子，导致两种更常用的 3D 检测方法：基于体素和基于柱子的方法。VoxelNet [46] 提出了一种基于体素的方法，将点云离散化每个子空间的 3D 网格称为体素。然后可以将密集的 3D 卷积网络应用于该网格以学习检测特征。 SEC OND [40] 建立在 VoxelNet 之上，并建议使用稀疏 3D 卷积来提高效率。由于 3D 体素的处理成本通常很高，PointPillars [16] 和 PIXOR [41] 进一步将 3D 体素简化为鸟瞰 2D 柱，其中具有相同 z 轴的所有体素都折叠为单个柱。然后可以使用现有的 2D 卷积检测网络处理这些 2D 柱子，以生成鸟瞰边界框。由于 2D 柱子通常易于快速处理，因此许多最近的 3D 检测方法 [34、38、43、44] 都是基于 PointPillars 构建的。在本文中，我们还选择 PointPillar 作为我们处理激光雷达点云的基线方法。
激光雷达相机融合。单目检测方法不依赖激光雷达点云，而是直接从 2D 图像中预测 3D 框 [3,15,27]。这些方法的一个关键挑战是 2D 图像没有深度信息，因此大多数单目检测器需要隐式或显式地预测每个 2D 图像像素的深度，这通常是另一项非常困难的任务。最近，有一种趋势是结合激光雷达和相机数据来改进 3D 检测。一些方法 [24, 39] 首先检测 2D 图像中的对象，然后使用该信息进一步处理点云。以前的论文 [4, 14] 也使用两阶段框架来执行以对象为中心的模态融合。与这些方法相比，我们的方法更容易插入到大多数现有的基于体素的 3D 检测方法中。
点装饰融合。PointPainting [34] 建议使用相机图像的语义分数来增强每个激光雷达点，这些图像是通过预先训练的语义分割网络提取的。PointAugmenting [36] 指出了语义分数的局限性，并提出利用从 2D 对象检测网络中提取的深度特征在相机图像之上增强激光雷达点。如图 1 (a) 所示，这些方法依赖于预训练模块（例如，2D 检测或分割模型）从相机图像中提取特征，这些特征用于对原始点云进行装饰，然后输入到激光雷达特征体素化器构建鸟瞰图伪图像。
中级融合。Deep Continuous Fusion [17]、EP Net [13] 和 4D-Net [23] 试图通过在 2D 和 3D 骨干之间共享信息来融合这两种模式。然而，这些方法中一个重要的缺失是相机和激光雷达特征之间的有效对齐机制，这在我们的实验中被证实是构建有效的端到端多模态 3D 物体检测器的关键。即使知道有效对齐的重要性，我们也指出这样做具有挑战性，原因如下。首先，为了在现有基准（例如 Waymo Open Dataset）上获得最佳性能，在融合阶段之前，将各种数据增强策略应用于激光雷达点和相机图像。例如，沿z轴旋转3D世界的Ran domRotation [46]通常应用于激光雷达点，但不适用于相机图像，这使得后续的特征对齐变得困难。其次，由于多个激光雷达点聚合成同一个3D立方体，即体素，在场景中，一个体素对应多个摄像头特征，而这些摄像头特征对于3D检测并不是同等重要的。

3.DeepFusion

3.1 节中，我们首先介绍我们的深度特征融合方案。然后，我们在第 3.2 节进行了一组初步实验，以定量说明对齐对深度特征融合的重要性。最后，我们在第 3.3 节中提出了两种技术，InverseAug 和 LearnableAlign，以提高对齐质量。

3.1深度特征融合方案

如图 1 (a) 所示，以前的方法，例如 PointPainting [34] 和 PointAugmenting [36]，通常使用训练有素的检测或分割模型作为相机特征提取器。例如，PointPainting 使用 Deeplabv3+1 生成每像素分割标签作为相机特征 [34]。然后，使用提取的相机特征对原始激光雷达点进行修饰。最后，将相机特征修饰的激光雷达点输入到 3D 点云对象检测框架中。
由于以下原因，上述方案是可改进的。首先，将相机特征输入几个专门为处理点云数据而设计的模块。例如，如果采用 PointPillars [16] 作为 3D 检测框架，则需要将相机特征与原始点云一起进行体素化，以构建鸟瞰伪图像。但是，体素化模块不是为处理相机信息而设计的。其次，相机特征提取器是从其他独立任务（即 2D 检测或分割）中学习的，这可能会导致（1）领域差距，（2）注释工作，（3）额外的计算成本，更重要的是，(4)次优提取特征，因为这些特征是启发式选择的，而不是以端到端的方式学习的。
为了解决上述两个问题，我们提出了一个深度特征融合方案。为了解决第一个问题，我们融合了深度相机和激光雷达特征，而不是在输入级别装饰原始激光雷达点，这样相机信号就不会通过为点云设计的模块。对于第二个问题，我们使用卷积层来提取相机特征，并以端到端的方式将这些卷积层与网络的其他组件一起训练。总而言之，我们提出的深度特征融合管道方案1 (b) 所示：将激光雷达点云输入现有的激光雷达特征提取器（例如，来自 PointPillars [16] 的 Pillar Feature Net）以获得激光雷达特征（例如，来自 PointPillars [16] 的伪图像）；将相机图像输入 2D 图像特征提取器（例如，ResNet [10]）以获得相机特征；然后，将相机特征融合到激光雷达特征；最后，融合特征由所选激光雷达检测框架的其余组件（例如，来自点柱[16]的主干和检测头）进行处理，以获得检测结果。
与之前的设计相比，我们的方法有两个好处：（1）具有丰富上下文信息的高分辨率相机特征不需要被错误地体素化，然后从透视图转换为鸟瞰图；(2)域差距和标注问题得到缓解，由于端到端训练可以获得更好的相机特征。然而，缺点也很明显：与输入级装饰相比，将相机特征与激光雷达信号对齐在深度特征级别变得不那么简单。例如，两种模态的异构数据增强导致的不准确对齐可能对融合阶段构成潜在挑战。在第 3.2 节中，我们验证错位确实会损害检测模型，并在第3.3节中提供我们的解决方案。

3.2.对齐质量的影响

为了定量评估对齐对深度特征融合的影响，我们禁用了所有其他数据增强，但仅在训练期间将 RandomRotation [46]的大小扭曲到我们深度融合管道的激光雷达点云。实验设置的更多细节可以在补充材料中找到。
由于我们只增强激光雷达点云但保持相机图像不变，更强的几何相关数据增强会导致更差的对齐。如表 1 所示，多模态融合的好处随着旋转角度的增大而减小。例如，当不应用增强时（最大旋转 = 0°），改进最显着（+2.6 AP）；当最大旋转为 45° 时，仅观察到 +0.4 AP 增益。基于这些观察，我们得出结论，对齐对于深度特征融合至关重要，如果对齐不准确，相机输入的好处就会变得微不足道。

3.3. 提高对齐质量

鉴于对齐深度特征的重要性，我们提出了两种技术，InverseAug 和 LearnableAlign，以有效地对齐来自两种模态的深度特征。

表1. 多模态融合的性能增益随着 RandomRotation [46] 幅度的增加而减少，这表明准确对齐的重要性。此处不使用 InverseAug。在 Waymo Open Dataset 行人检测任务上，报告了 LEVEL 1 AP 从单模态到多模态的改进。有关详细信息，请参阅第 3.2 节

InverseAug 为了在现有基准上获得最佳性能，大多数方法都需要强大的数据增强，因为训练通常会陷入过度拟合的情况。从表 1 中可以看出数据增强的重要性，其中单模态模型的准确性可以提高多达 5.0。此外，Cheng 等人。[5]还提出了数据增强对于训练 3D 对象检测模型的重要性。然而，数据增强的必要性给我们的 DeepFusion 方案带来了不小的挑战。具体来说，来自两种模态的数据通常使用不同的增强策略进行增强（例如，沿z轴旋转3D点云结合随机翻转2D图像），使得对齐具有挑战性。
为了解决几何相关数据增强引起的对齐问题，我们提出了 InverseAug。如图 2 所示，对点云应用数据增强后，给定增强空间中的 3D 关键点（可以是任意 3D 坐标，如激光雷达点、体素中心等），仅使用原始激光雷达和相机参数，无法将相应的相机特征定位在二维空间中。为了使定位可行，InverseAug 在应用几何相关数据增强时首先保存增强参数（例如，RandomRotate [46] 的旋转度）。在融合阶段，它反转所有这些数据增强以获得 3D 关键点的原始坐标（图 2（c）），然后在相机空间中找到其对应的 2D 坐标。请注意，我们的方法是通用的，因为它可以对齐不同类型的关键点（例如，体素中心），尽管为了简单起见，我们仅在图 2 中采用激光雷达点，并且它还可以处理两种模态都增强的情况。相比之下，现有的融合方法，如 PointAugmenting [36] 只能在增强之前处理数据。最后，我们在图 3 (b) 中展示了通过 InverseAug 改进对齐质量的示例。
LearnableAlign 对于 PointPainting [34] 和 PointAugmenting [36] 等输入级装饰方法，给定一个 3D 激光雷达点，由于存在一对一映射，因此唯一对应的相机像素可以准确定位。相比之下，在我们的 DeepFusion 方案中融合深度特征时，每个激光雷达特征代表一个包含点子集的体素，因此其对应的相机像素位于多边形中。所以对齐变成了一个体素对多像素的问题。一种简单的方法是对与给定体素对应的所有像素进行平均。然而，直观地说，并且正如我们的可视化结果所支持的那样，这些像素并不同样重要，因为来自激光雷达深度特征的信息与每个摄像头像素不均等地对齐。例如，一些像素可能包含用于检测的关键信息，例如要检测的目标对象，而其他像素可能信息量较少，包括道路、植物、遮挡物等背景。为了更好地将来自激光雷达特征的信息与最相关的相机特征对齐，我们引入了LearnableAlign，它利用交叉注意机制来动态捕获两种模态之间的相关性，如图 1 所示，具体来说，输入包含一个体素单元及其所有对应的N个相机特征。

4.实验

具体实验看论文吧

图2. InverseAug 的方法。提出的 InverseAug 的目标是将数据增强阶段之后获得的关键点，即 (a) → (b) 投影到 2D 相机坐标系。关键点是一个通用概念，可以是任何 3D 坐标，例如激光雷达点或体素中心。为简单起见，我们在这里使用激光雷达点来说明这个想法。通过使用相机和激光雷达参数直接将关键点从增强的 3D 坐标系投影到 2D 相机坐标系，即直接从 (b) 到 (d)，精度较低。在这里，我们建议首先通过将所有数据增强反向应用到 3D 关键点来找到原始坐标中的所有关键点，即 (b) → (c)。然后，可以使用激光雷达和相机参数将 3D 关键点投影到相机特征，即 (c) → (d)。 InverseAug 显着提高了对齐质量，如图 3 所示。

5.总结

本文研究如何有效融合激光雷达和摄像头数据以进行多模态 3D 目标检测。我们的研究表明，当它们对齐良好时，后期的深度特征融合会更有效，但是对齐来自不同模态的两个深度特征是具有挑战性的。为了应对这一挑战，我们提出了两种技术，InverseAug 和 LearnableAlign，以获得多模态特征之间的有效对齐。基于这些技术，我们开发了一系列简单、通用但有效的多模态 3D 检测器，名为 DeepFusions，它在 Waymo 开放数据集上实现了最先进的性能。

AI人工智能领域：Bard的崛起之路 AIGC应用创新大全人工智能 bard ai
AI人工智能领域：Bard的崛起之路关键词：Bard、GoogleAI、大语言模型、对话式AI、自然语言处理、生成式AI、AI竞争摘要：本文深入探讨GoogleBard的发展历程、技术架构及其在AI领域的地位。我们将从Bard的诞生背景开始，分析其核心技术原理，比较与其他大语言模型的异同，并通过实际案例展示其应用场景。最后展望Bard的未来发展方向及面临的挑战。背景介绍目的和范围本文旨在全面解析G
AI人工智能领域深度学习的跨模态检索技术 AI学长带你学AI AI人工智能与大数据应用开发 AI应用开发高级指南人工智能深度学习 ai
AI人工智能领域深度学习的跨模态检索技术关键词：跨模态检索、深度学习、多模态学习、特征提取、相似度计算、注意力机制、Transformer摘要：本文深入探讨了AI领域中基于深度学习的跨模态检索技术。我们将从基础概念出发，详细分析跨模态检索的核心算法原理、数学模型和实际应用。文章包含完整的Python实现示例，展示如何构建一个跨模态检索系统，并讨论当前的技术挑战和未来发展方向。通过本文，读者将全面理
Python程序设计第6章：函数和函数式编程若北辰 Python程序设计 python 开发语言
Python程序设计Python是全球范围内最受欢迎的编程语言之一，学好Python将对个人职业生涯产生很大的助力，Python在机器学习、深度学习、数据挖掘等领域应用极为广泛。在数据科学家/数据分析师、人工智能工程师、网络安全工程师、软件工程师/全栈工程师、自动化测试工程师等岗位，年入50万，很普遍，学好Python，高薪就业不是问题，因此推出Python程序设计系列文章：Python程序设计第
什么是神经网络和机器学习？【云驻共创】一键难忘人工智能机器学习深度学习神经网络网络
什么是神经网络和机器学习？一.背景在当今数字化浪潮中，神经网络和机器学习已成为科技领域的中流砥柱。它们作为人工智能的支柱，推动了自动化、智能化和数据驱动决策的进步。然而，对于初学者和专业人士来说，理解神经网络和机器学习的本质是至关重要的。在本文中，我们将深入探讨这两个概念的内涵、工作原理以及彼此之间的联系。二.神经网络和机器学习简介神经网络和机器学习都是人工智能领域中的重要概念，它们通常用于解决各
AI人工智能与OpenCV：实现智能图像编辑功能 AI智能探索者 AI Agent 智能体开发实战人工智能 opencv 计算机视觉 ai
AI人工智能与OpenCV：实现智能图像编辑功能关键词：人工智能、OpenCV、图像处理、计算机视觉、深度学习、智能编辑、图像增强摘要：本文深入探讨如何结合人工智能(AI)和OpenCV实现智能图像编辑功能。我们将从基础概念出发，详细介绍核心算法原理，展示实际代码实现，并分析典型应用场景。文章将涵盖从传统图像处理技术到深度学习方法的演进，重点讲解如何利用OpenCV和AI模型实现自动化的图像增强、
Orangepi Zero2 全志H616开发学习会学嵌入式 ARM Linux全志平台开发学习 linux 开发语言服务器
一.简介1.1为什么学学习目标依然是Linux系统，平台是ARM架构·蜂巢快递柜，配送机器人，这些应用场景用C51,STM32单片机无法实现·第三方介入库的局限性，比如刷脸支付和公交车收费设备需要集成支付宝SDK，提供的libalipay.so是Linux的库，设备必须跑Linux系统·图像识别，音频，视频等领域的技术支撑也无法脱离Linux系统·人工智能型设备通常需要更好的系统和更高的算力，所以
人工智能-基础篇-2-什么是机器学习？（ML，监督学习，半监督学习，零监督学习，强化学习，深度学习，机器学习步骤等） weisian151 人工智能人工智能机器学习学习
1、什么是机器学习？机器学习（MachineLearning,ML）是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析等数学理论。其核心目标是让计算机通过分析数据，自动学习规律并构建模型，从而对未知数据进行预测或决策，而无需依赖显式的程序指令。基本思想：通过数据驱动的方式，使系统能够从经验（数据）中改进性能，形成对数据模式的抽象化表达。基本概念：模型：模型是对现实世界现
2025年AI十大趋势：从多模态大模型到自主智能体 zhuzhi 人工智能大数据
2025年AI十大趋势：从多模态大模型到自主智能体人工智能技术正以前所未有的速度重塑着我们的世界。2025年，AI领域将迎来一系列突破性进展，从多模态大模型的全面进化到自主智能体的广泛应用，这些技术变革正在重新定义人机交互的边界。本文将系统梳理2025年AI发展的十大核心趋势，为读者揭示人工智能技术的最新发展方向及其对社会各领域的深远影响。趋势一：多模态大模型成为基础设施2025年，多模态大模型已
对话式AI助手的巅峰对决：ChatGPT与文心一言的实用价值探讨酷钉 chatgpt 人工智能
随着人工智能技术的发展，对话式AI助手逐渐成为了人们生活中的一部分。其中，ChatGPT和文心一言更是备受关注的两款对话式AI助手。本文将探讨这两款AI助手的实用价值，并通过案例和数据的方式进行分析。一、ChatGPT的实用价值跨语言交流ChatGPT是一款能够进行跨语言交流的对话式AI助手。据统计，ChatGPT支持的语言数量超过100种，用户可以通过它轻松地与不同国家和地区的人进行交流。例如，
微信小程序｜流浪动物救助小程序的设计与实现 qq_469603589 微信小程序小程序微信小程序
作者主页：编程指南针作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、腾讯课堂常驻讲师主要内容：Java项目、Python项目、前端项目、人工智能与大数据、简历模板、学习资料、面试题库、技术互助收藏点赞不迷路关注作者有好处文末获取源码项目编号：L-BS-XZBS-30一，环境介绍语言环境：Java:jdk1
Dimba: Transformer-Mamba Diffusion Models————3 Methodology
图解图片中的每个模块详解1.文本输入(Text)描述：输入的文本描述了一个具有具体特征的场景。功能：提供关于要生成图像的详细信息。2.T5模型(TexttoFeature)描述：使用T5模型将文本转换为特征向量。功能：提取文本中的语义信息，为后续的图像生成提供条件。3.图像输入(Image)描述：输入图像通过变分自编码器(VAE)编码器处理。功能：将图像转换为潜在表示，用于添加噪声并进行扩散过程。
如何禁止GPTBot等爬虫爬取网站内容：保护数据安全的实用指南淮橘√ 人工智能
引言随着人工智能技术的快速发展，网络爬虫（如OpenAI的GPTBot、GoogleBot、Anthropic的ClaudeBot等）被广泛用于抓取网站数据以训练AI模型或索引内容。然而，部分网站管理员可能不希望自己的内容被爬虫抓取，原因包括保护原创内容、降低服务器负载或防止数据被滥用。一、为什么需要禁止爬虫？网络爬虫可能带来以下问题：内容盗用风险：原创内容可能被AI模型或其他服务未经授权使用。服
Java 与 AI 携手，掀起多领域智能变革浪潮 WangRK_ 人工智能 java 开发语言
在数字化转型的时代浪潮下，技术更新迭代速度超乎想象。当Java这门历经二十余年沉淀的编程语言，遇上风头正劲的人工智能（AI），一场席卷多领域的智能变革正悄然发生。尤其是在金融与零售两大行业，这场技术融合带来的改变，正重塑着整个行业的生态。一、Java在金融与零售行业的“前世今生”（一）曾经的行业基石在金融领域，Java堪称“代码钢铁侠”，是金融基础设施的坚实支柱。全球顶级交易所依靠Java强大的性
筑牢医疗AI安全防线：四重防护体系全解析 Allen_Lyb 数智化教程（第二期）人工智能安全
一、引言：医疗AI发展中的安全困境在数字化浪潮席卷下，医疗领域正经历着一场由人工智能（AI）驱动的深刻变革。医疗AI凭借其强大的数据分析与处理能力，在疾病诊断、药物研发、健康管理等诸多环节展现出巨大潜力，成为推动医疗行业进步的关键力量。而这一切的背后，医疗数据作为AI发展的“燃料”，以及AI算力作为运行的“引擎”，起着不可或缺的核心作用。医疗数据涵盖了患者从基本信息、病史、症状描述到各种检查检验报
Open AI在AI人工智能领域的技术安全防护体系 AI智能探索者 AI Agent 智能体开发实战人工智能安全网络 ai
OpenAI在AI人工智能领域的技术安全防护体系关键词：OpenAI、AI安全、技术防护、伦理框架、模型对齐、数据隐私、对抗攻击摘要：本文将深入探讨OpenAI在人工智能领域构建的多层次技术安全防护体系。我们将从基础概念出发，逐步解析OpenAI如何通过技术创新和系统设计来确保AI系统的安全性、可靠性和可控性。文章将涵盖从数据安全到模型对齐，从伦理框架到实际防护技术的全方位内容，帮助读者全面理解现
揭秘自然语言处理在AI人工智能领域的奥秘 AI智能探索者 AI Agent 智能体开发实战人工智能自然语言处理 easyui ai
揭秘自然语言处理在AI人工智能领域的奥秘关键词：自然语言处理、AI人工智能、语言理解、语言生成、语义分析摘要：本文深入探讨了自然语言处理（NLP）在AI人工智能领域的奥秘。首先介绍了自然语言处理的背景，包括目的、预期读者、文档结构和相关术语。接着阐述了自然语言处理的核心概念与联系，通过文本示意图和Mermaid流程图进行展示。详细讲解了核心算法原理和具体操作步骤，并用Python源代码进行阐述。分
数字ic后端设计从入门到精通9（含fusion compiler, tcl教学）setup time, hold time check lib/report详解 soulermax 单片机嵌入式硬件
checklib标准单元库中建立时间和保持时间约束的check格式用于数字IC设计中的静态时序分析（STA）。它定义了如何用表格形式表达触发器等顺序单元在不同输入信号和时钟转换速率下的建立和保持时间。（对应工艺角的lib文件）示例结构pin(D){direction:input;...timing(){related_pin:"CK";timing_type:"setup_rising";rise
数字ic后端设计从入门到精通8（含fusion compiler, tcl教学）ULVTLL、LVT、ULVT详解及应用 soulermax 硬件架构
LVTvsULVTvsULVTLL：从PPA、成本的角度出发比较维度LVTULVTULVTLL阈值电压(Vth)中等低极低但经过优化减少泄漏开关速度中等快略慢于ULVT但优于LVT驱动能力较低高较高，略低于ULVT漏电流较低高显著低于ULVT动态功耗中等低低静态功耗低高低面积小小略大（因需额外技术减少泄漏）延迟中等到高低略高于ULVT但低于LVT适用场景常规路径关键路径对功耗敏感的关键路径成本相对
【LangChain编程：从入门到实践】AI 大模型检索增强生成 RAG 实践 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LangChain编程：从入门到实践-AI大模型检索增强生成RAG实践关键词：LangChain,RAG,大语言模型,检索增强生成,向量数据库,嵌入模型,提示工程1.背景介绍在人工智能和自然语言处理领域,大语言模型(LargeLanguageModels,LLMs)的出现无疑是一个重大突破。像GPT-3、GPT-4这样的模型展现出了惊人的语言理解和生成能力,为各种应用场景带来了无限可能。然而,这些
AI离全社会普及，只差一个计算中心？ a13163944010 人工智能
过去十年，人工智能（AI）大爆炸，并第一次走进普通人的生活。但蓬勃发展的AI却碰到一个空前棘手的问题：自2012年以来，AI算力需求6年增长30万倍，远超摩尔定律！人类现有的基础设施，已跟不上AI算力需求的增长。未来，该怎么办？【1】一百多年前，人类也曾面临同样的难题。1866年，德国西门子发明自激发电机，开启了人类的电力时代。此后十几年，虽然很多企业纷纷采用电能这种新的动力，但一台电机只能供应一
首次使用“非英伟达”芯片！OpenAI租用谷歌TPU，降低推理计算成本加百力科技知识财经研究人工智能 chatgpt
OpenAI近期开始租用谷歌TPU芯片，这是该公司首次大规模使用非英伟达芯片。除了OpenAI外、苹果、SafeSuperintelligence和Cohere等公司也一直租用谷歌云的TPU。英伟达的芯片主导地位正被侵蚀，OpenAI租用谷歌TPU，为首次大规模使用“非英伟达”芯片。周六，据媒体报道，作为全球最大的人工智能芯片客户之一，OpenAI近期开始租用谷歌的TPU芯片为ChatGPT等产品
AI人工智能神经网络马里亚纳海沟网人工智能神经网络深度学习笔记运维全文检索搜索引擎
**AI人工智能神经网络概述**神经网络是并行计算设备，它们试图构建大脑的计算机模型。背后的主要目标是开发一个系统来执行各种计算任务比传统系统更快。这些任务包括模式识别和分类，近似，优化和数据聚类什么是人工神经网络(ANN)人工神经网络(ANN)是一个高效的计算系统，其核心主题是借用生物神经网络的类比。人工神经网络也被称为人工神经系统，并行分布式处理系统和连接系统。ANN获取了大量以某种模式相互连
智能办公与科研革命：ChatGPT+DeepSeek大模型在论文撰写、数据分析与AI建模中的实践指南 jwwkyjspt 机器学习 SCI论文人工智能 chatgpt 语言模型机器学习
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
初学Spring AI 笔记笑衬人心。大模型学习 spring 人工智能笔记
目录SpringAI简介依赖与环境配置基础概念集成OpenAI（或其他LLM提供商）Prompt模板引擎Embedding与向量数据库SpringAIChatClient使用SpringAI和LangChain对比常见问题与建议SpringAI简介SpringAI是Spring团队推出的人工智能集成框架，旨在简化AI模型（如OpenAI、HuggingFace、Mistral、AzureOpenA
AI新高度——DEEPSEEK 数字隐士·赛博智者 ai
DeepSeek是由中国人工智能公司「深度求索」开发的一系列高性能大语言模型产品及相关技术体系，其定位为通用人工智能（AGI）探索者，目前已发展成为全球增长最快、性能领先的开源模型之一。下面是关于DeepSeek的详细介绍：一、DeepSeek的开发者与背景‌公司名称‌：杭州深度求索人工智能基础技术研究有限公司（成立于2023年）‌核心支持‌：由中国知名对冲基金「高毅资产」创立并提供资金与技术资源
LLM大语言模型学习笔记（1） Arixs666 大语言模型语言模型笔记人工智能
1.概念大语言模型（LLM，LargeLanguageModel），也称大型语言模型，是一种旨在理解和生成人类语言的人工智能模型。LLM通常指包含数百亿（或更多）参数的语言模型，它们在海量的文本数据上进行训练，从而获得对语言深层次的理解。2.能力2.1涌现能力区分大语言模型（LLM）与以前的预训练语言模型（PLM）最显著的特征之一是它们的涌现能力。涌现能力是一种令人惊讶的能力，它在小型模型中不明显
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
数字孪生：未来城市管理的革命性技术大有数据可视化信息可视化
一、数字孪生技术概述数字孪生技术是一种通过创建虚拟模型与物理实体之间实时交互的技术。它借助物联网、大数据、云计算、人工智能等前沿技术，实现对物理实体的精准映射与动态仿真。数字孪生的核心在于构建一个与物理世界相对应的虚拟模型，该模型能够实时反映物理实体的状态，并通过数据分析与模拟优化其性能。在城市管理领域，数字孪生技术为城市管理者提供了一种全新的视角和工具。城市是一个复杂的巨系统，涉及基础设施、交通
人类编程时代即将终结？OpenAI首席产品官预测AI将在今年底全面超越人类程序员前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读近日，OpenAI首席产品官KevinWeil在接受采访时表示，人工智能的发展速度远超预期，今年底就有可能在编程领域永久性地超越人类程序员。这一观点立即引发了行业热议，也让程序员们对未来产生了深刻的思考。人工智能的进展速度远超想象在与VarunMayya和TanmayBhat共同主持的YouTube节目《O
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL