tt姐whaosoft

实时车载激光雷达感知的点云深度学习

又来卷这个了，此次调查了神经网络中使用的计算表示与其性能特征之间的关系，提出了现代深度神经网络中用于3D点云处理的LiDAR点云表示的新计算分类法。使用这种分类法，对不同的方法家族进行结构化分析，论文揭示了在计算效率、内存需求和表示能力方面的共同优势和局限性，最后，论文为基于神经网络的点云处理方法的未来发展提供了一些见解和指导。

激光雷达传感器是自动驾驶汽车不可或缺的一部分，因为它们提供了汽车周围环境的精确、高分辨率3D表示。然而，在计算上很难利用来自多个高分辨率激光雷达传感器不断增加的数据量。随着帧速率、点云大小和传感器分辨率的增加，这些点云的实时处理仍必须从车辆环境的这张日益精确的图片中提取语义。在这些点云上运行的深度神经网络性能和准确性的一个决定因素是底层数据表示及其计算方式。本文调查了神经网络中使用的计算表示与其性能特征之间的关系，提出了现代深度神经网络中用于3D点云处理的LiDAR点云表示的新计算分类法。使用这种分类法，对不同的方法家族进行结构化分析，论文揭示了在计算效率、内存需求和表示能力方面的共同优势和局限性，这些都是通过语义分割性能来衡量的。最后，论文为基于神经网络的点云处理方法的未来发展提供了一些见解和指导。

自动驾驶领域正在迅速发展，尤为明显的一个是激光雷达处理领域，该领域最近越来越受到计算机视觉和深度学习社区的关注。与此同时，传感器硬件也在不断发展，随着该行业的主要参与者推动对低成本、高分辨率传感器的需求，它们变得越来越便宜，并且越来越广泛。遵循这一趋势，最近的研究车辆和原型通常配备了多个高分辨率激光雷达传感器，现代传感器能够每秒以10 Hz或以上的帧速率为每个传感器提供数百万点！

这些快速且高分辨率的传感器产生大量数据，这些数据必须实时处理，以用于自动驾驶的感知功能。对于许多需要语义或几何推理的感知任务，如目标检测和语义分割，只有深度学习方法能提供最先进的处理能力。然而，许多可用于处理如此规模的激光雷达点云的深度学习方法无法满足车载部署的实时推断延迟要求，论文推测，推理运行时性能的最重要设计决策取决于底层的学习数据表示。多篇论文将方法分类为基于点、基于投影或有时基于体素的方法，以简化与最新方法的比较[11-13]。然而，这种分类并不能充分反映在新架构开发过程中做出的设计决策的多样性，作者还发现，没有对这些设计决策对运行时性能的影响进行实质性的、客观的分析或比较，因为每篇论文都关注所提出的方法。本文基于点云数据表示的设计决策，提出了不同体系结构设计的分类。通过选择显式或隐式空间结构、选择内部表示维度、选择坐标空间以及最终选择特征聚合方法对方法进行分类。第2节详细描述了该分类法，使用介绍的分类法，在第3节中分析了这些设计决策对运行时性能特征的影响。最后，基于此分析，还为第4节中的未来工作提供了见解和建议。

激光雷达点云的neural 表示分类

分类以开发过程中的设计决策为中心，这将导致点云在深度神经网络中的最终表示。在图1中，使用论文的分类法说明了常见点云表示的分类，值得注意的是，图1所示的分类并不详尽，因为在所呈现的设计决策之间存在许多可能的选择组合。

空间结构：作者观察到的第一个设计决策（图1，第一层）是在内存中数据的显式或隐式多维空间排列之间进行选择。显式空间结构直接编码所表示数据的存储器布局中的位置信息。通常，点云的光栅化表示可以通过点的坐标来索引，以接收其特征向量。相比之下，隐式空间结构将点的特征向量存储在稀疏表示中。在这种情况下，点的坐标和/或单独的索引数据结构通常被存储以编码位置信息，并被访问以提取邻域关系[14-16]，图2显示了示例性一维点云的差异。

光栅化维度：论文观察到的第二个设计决策（图1，第二层）是点云内部数学表示的维度，观察到的主要种类是三维体素表示、三维空间的二维投影和一维未排序的基于集合或列表的表示[17，13，18]。作者将一维表示称为“点包”，因为它们的顺序通常与对它们执行的操作无关，多维表示将空间光栅化为有限数量的网格单元，将每个存储单元与3D或2D空间的一部分对齐。表示维度的决定与存储器布局正交，因为多维光栅化也可以稀疏地存储在一维数据结构中[15]。图3说明了不同的光栅化维度！

坐标系：作者观察到的第三个设计决策（图1，第三层）涉及坐标系的选择，用于多维空间的光栅化。光栅化将2D或3D空间划分为有限大小的块，该分区通常沿坐标轴上的规则间隔执行。因此，为该划分选择的坐标轴也会影响结果表示如何划分3D空间，这里主要区分笛卡尔坐标系和极坐标系，笛卡尔坐标系统指的是三维欧几里得空间中的绝对位置[12]，而极坐标系指的是角度和距离测量的组合[19，20]，图4（左）说明了不同的坐标系如何导致二维空间的不同光栅化。球坐标是极坐标的延伸，它使用两个角度和一个距离测量来索引三维空间。沿径向轴投影球面坐标会产生距离图像2D表示，还有各种坐标系，它们结合了不同轴的极坐标和笛卡尔几何。图4显示了一个例子：圆柱坐标使用极坐标系表示X-Y平面，笛卡尔轴表示Z方向。类似地，一些方法在二维鸟瞰图（BEV）投影中使用极坐标系，该投影沿笛卡尔z轴投影点[19]。对于极坐标系，通常选择坐标原点作为LiDAR传感器的中心，以最小化混叠。

在自动驾驶汽车中，有两个主要的资源约束影响感知系统，即内存和计算时间。部署的硬件仅提供有限的内存，因此，点云表示所消耗的内存量应保持在合理的范围内。更重要的是，在移动的车辆中，计算时间受到严重限制，因为任何产生的延迟都会使感知系统的输出过时。过时的观察在一定限度内仍然有用，因此延迟应尽可能低。然而，更实际的硬约束是由车辆传感器产生数据的速率给出的，如果感知组件的延迟小于其处理数据的传感器的帧速率（对于当前的LiDAR传感器，通常约为10Hz），则该方法可以被视为具有实时能力。

这些资源约束与感知模型的表征能力形成对比，即其从传感器数据中正确推断环境信息的能力。在这项工作中，论文基于广泛使用的SemanticKITTI基准，使用语义分割性能作为表征能力的代理。然而，这里提出的相同设计决策和含义可能会推广到3D对象检测，作为类似分析的起点，多项调查提供了最近3D对象检测方法的概述[26-28]。通常，较大的模型具有较高的表示能力，但也具有较高的资源利用率[18，29，11]。因此，困难在于创建具有高表示能力的感知模型，该模型仍然可以在车载硬件上运行实时推理。在接下来的几节中，论文将从第2节介绍的分类中检查每个设计决策对内存消耗、运行时延迟和表示能力的影响。

空间结构的选择

本节分析了在点云表示的内存对齐中选择显式或隐式空间结构的影响，空间结构的选择对表征能力没有直接影响，因为相同的数学运算可以是在两种存储器布局上执行。因此，从数学角度来看，这个选择是一个实现细节。然而，在实践中，内存布局可能会对深度学习模型的运行时间和内存消耗产生很大影响。显式空间结构的一个主要优点是它直接对空间信息进行编码，从而通过存储器布局对空间局部性进行编码。因此，在点的局部邻域中找到特定位置的特征向量可以以O（1）时间复杂度运行，而与点云大小无关。

如图2所示，其中可以通过访问显式表示（中心行）中的单元0和2直接访问单元1中的点F的邻域。相比之下，要在隐式表示中找到点F的邻域（底行），必须遍历N个点的整个列表（O（N）操作），或者构造和导航一些外部索引结构，例如KD树或哈希图，作者将此邻居查找时间列为表3中的tlookup。作为一个额外的好处，内存布局中的空间局部性通常会导致更好的缓存局部性，因为当相邻数据被访问时，相邻数据通常已经被缓存。在通常用于这些模型的GPU加速器上，由于架构细节，并行访问相邻存储单元也可能比随机访问快得多[38，39]。

明确的空间结构的主要缺点是激光雷达数据本身的空间稀疏性。由于LiDAR点在3D空间中分布不均匀，因此显式表示通常会导致大量的空存储单元，这些空存储单元表示没有LiDAR的空间部分。根据数据表示的选择，很大一部分内存可能被空的空间单元占用，其中没有LiDAR点[17，13]。默认情况下，卷积等操作的实现对这些空单元的处理与填充单元的处理没有任何区别。因此，不仅内存，而且计算时间都浪费在空空间上。如图3所示，随着网格单元的分辨率r变得更精细，这种浪费内存和计算周期的问题增长得非常快，特别是对于明确的3D体素方法，内存需求往往会非常快地爆炸，从而大大限制了实际可用的分辨率。

光栅化维度的选择

内部数学点云表示的维度选择对于运行时和表示能力都非常重要，如果选择显式表示，内部表示的光栅化维度也会影响内存成本的缩放，如上节所述。构建和访问光栅化和非光栅化表示需要不可忽略的时间，尤其是在低延迟用例中。表示的构造和访问时间在很大程度上取决于光栅化维度，在表3中进行了定性比较。

如上所述，点云上的深度神经网络通常聚集邻域信息以推断点的特征。根据表示是否光栅化（2D或3D、点包），查找邻居可以是数据结构中的查找，也可以是最近邻居搜索，这会显著影响邻居查找延迟tlookup。为了减少邻域查找时间，point-package表示通常与搜索树索引结构（如KD树）相结合[16]，然而，即使在这些树结构中，邻域搜索仍然很昂贵，并且它们的构建也需要大量时间。因此，对于相似数量的参数和mIoU分数，非光栅化表示（表2中的BoP+邻居）通常比光栅化方法（表2中的距离图像或稀疏体素CNN）需要更长的时间来计算和处理其内部表示。虽然访问光栅化表示要快得多，但它们的构建需要不可忽略的时间，对于基于2D投影的方法，Liu等人[11]报告了投影计算的延迟约为24毫秒。对于稀疏3D光栅化，这相当于每个点的散列图插入[15]。

由于这些运行时间限制，基于稀疏体素的方法在超过100ms的延迟之前，往往具有少于1000万个参数（如[15]中所报告的15-200亿次乘法累加（MAC）操作）。相比之下，具有显式表示的2D CNN具有数千万个参数的更高限制（根据[15]，大约2000亿个MAC）。因此，对于相似的延迟约束，稀疏3D卷积神经网络似乎比2D CNN具有低得多的参数预算。然而，这些3D模型的IoU分数通常高于具有可比参数数量的2D CNN（比较表2中的距离图像与稀疏体素CNN）。这表明3D表示对于类似的参数预算能够实现更高的表示能力。Triess等人进行的分析支持了这一点。[20]他们发现基于2D范围图像的CNN在缩放参数计数方面快速达到递减的回报，论文推测这可能是由于变化表示中存在的固有不变性。

随着光栅化表示的维数的改变，这也会影响点的邻域的大小和结构。在3D体素表示中，每个体素最多有六个直接邻域，对于3x3x3卷积，考虑27个体素的邻域。在2D中，每个像素有四个直接邻域，3x3卷积考虑9个像素的邻域。典型的邻域聚合操作所需的时间随访问的邻域数量（表3和表4中的邻域）而变化，这受光栅化维度的显著影响，这种对邻域大小的影响是推理时间的重要考虑因素。选择光栅化维度的另一个重要考虑因素是表示的结果稀疏性，与2D范围图像投影相比，典型的三维体素空间中的点将稀疏得多[17，20]。

坐标系的选择

数学坐标系的选择对于表征能力非常重要。由于坐标系赋予了距离的概念，这种选择会影响点的局部邻域，由于深度学习方法通常在这个局部邻域上聚合特征，这也会影响表示能力，并且在较小程度上影响运行时延迟。鉴于几乎所有基于光栅化的方法都使用卷积来聚集特征，它们在内部坐标系中继承了平移不变性。根据这个坐标系，这可能导致3D空间中的不同不变性，这再次影响了表征能力。表1比较了与平移不变特征聚集方法一起使用时各种光栅化坐标系的不变性，目前似乎存在平移不变性和围绕传感器旋转的不变性的互斥性，此外，没有列出的光栅化表示提供围绕任意轴的旋转不变性。基于表示能力，论文没有发现明显的首选坐标系。然而，最近的结果表明，利用包括具有旋转和平移不变性的坐标系在内的多种表示可以显著提高语义分割性能[12，37]。

由于激光雷达传感器使用径向光束扫描环境，因此所得点云的密度随着距离的增加而降低[5]。在笛卡尔坐标系中，这导致点的局部密度存在较大差异，可能会妨碍训练稳定性。极坐标系统不会受到这种不平衡的影响，其代价是利用不均匀的空间截面，这可能再次对表示能力产生负面影响。基于角度的表示（如距离图像投影）也对坐标原点的选择敏感。这种灵敏度使得它们在多传感器应用中的使用更具挑战性，因为这些点不再均匀分布在径向中心周围。

特征聚合方法的选择

如上述所述，深度学习方法通常通过聚集来自其局部邻域的特征来计算3D位置的特征表示。对于点袋表示，特征聚集方法的选择通常成为一个区别因素，而光栅化（2D或3D）表示通常与卷积结合使用，聚合方法的选择会显著影响表示能力和运行时间延迟。

论文观察到，每种特征聚合方法都会在延迟和表示能力之间进行权衡。模型的表征能力通常与其参数数量相关，这也反映在表2中，因为参数的数量越高，语义分割的性能越高。因此，参数数量与其运行时延迟之间的比率可能是聚合方法对于低延迟用例的适用性的有用指示。在表4中列出了深度神经网络中使用的各种常见特征聚合方法的理论运行时间和参数缩放。这里，M是特征被聚集的位置的数量，d是每个位置的特征向量的维数，neighbors表示其特征被聚集的邻域中的位置的数量，tlookup表示在表示或外部索引结构中查找相邻位置并从内存加载其特征向量所需的时间。从这个表中可以观察到卷积和全连接层的参数计数与诱导延迟的比率最高，尤其是当使用具有高内存查找时间（tlookup）的表示时。全连接的层不会跨相邻层聚合要素，因此，它们需要与单独的邻域聚合方法相结合，这会影响组合的运行时成本。选择特征聚合方法的另一个重要考虑因素是表示的结果不变性。例如，卷积将平移不变性赋予表示，这可能会积极影响表示能力[40]。作者鼓励未来的工作尝试聚合方法，这些方法可以提供对点云尺度、密度或绕任意轴旋转的不变性。

上节单独检查了建议分类中的每个设计决策对内存消耗、延迟和表示能力的影响。在本节中，作者采取相反的观点，检查每个结果：即内存消耗、运行时延迟和表示能力，它们受哪些设计决策的影响最大！

内存：点云表示的内存消耗最显著地受到显式或隐式内存布局的影响，如表2所列，隐式表示的内存消耗特性大致相同，随数字线性缩放点数。因此，通过选择隐式内存布局，任何点云表示都可以减少到O（N·d）内存复杂性，不包括任何索引结构。这里，N是点云中的点的数量，d是每个点的特征向量的维数，如上面所述，由于在内存中表示空的空间部分，具有显式空间结构的表示通常不太具有内存效率。

光栅化表示的内存消耗通常由使用的最细粒度网格分辨率决定，因此，对于某些应用程序来说，将稀疏隐式存储器布局用于细粒度光栅化，并将显式低分辨率特征映射用于粗网格表示可能是有用的，这可能会更快地操作，同时产生很少的稀疏性。一些显式表示比其它表示的稀疏性小得多，因此可以更精确地表示整个点云，而无需额外的内存开销。也就是说，基于距离图像的2D光栅化可以以这样的方式执行它们的投影，即它们的memory表示几乎不会产生稀疏性[20]。相比之下，笛卡尔表示通常具有最高的稀疏性，因为远离传感器的区域中的空间单元（即低点密度）仍然由细粒度网格单元表示。因此，对于明确的2D或3D光栅化，还应考虑坐标系的选择！

延迟：在计算点云表示过程中产生的运行延迟受多个设计决策的影响，由于特征是针对点云表示中的每个空间位置逐元素聚合的，因此空间位置的数量是一个重要因素。对于隐式空间表示，这通常是点云中的点数，而对于显式表示，这取决于光栅化分辨率。给定足够精细的空间分辨率，隐式表示通常会产生更少的空间位置，因此计算速度要快得多。下一个要考虑的因素是构建表示的初始延迟开销，这一开销包括投影、光栅化的成本，但也包括为隐式表示构建额外索引结构（如KD树或哈希图）的成本。由于开销通常不受以下模型规模的影响，因此考虑小模型尤为重要，因为它可能导致总延迟的很大一部分。延迟的另一个重要考虑因素是特征聚合的持续时间，这一时间受要聚合的邻居数量的影响，即表示维度和聚合的接受域，然而它也受到邻居查找时间的显著影响。这在表2中的非结构化点包表示中尤为明显，因此显式与隐式表示的选择再次显著影响运行时延迟。最后，运行时延迟也随所用模型的大小而变化，当模型使用更大的特征维度、更多的参数和更多的计算时，运行时间会相应地扩展。如表2所示，运行时间相对于参数数量的比例很大程度上受到特定表示选择的影响。正如从这个比较中观察到的，光栅化的2D CNN通常有一些初始开销，但当增加其参数计数时，它们的延迟最小。如果可以接受稍高的延迟，稀疏的3D CNN也提供了一种高性能的替代方案[20，11]。 whaosoft aiot http://143ai.com

Capacity：点云的表示能力受到模型中参数数量的显著影响，可以使用表示中特征向量的维数d对其进行缩放。然而，另一个重要的考虑是特征聚合方法可以从表示中直接推断出底层3D结构，如表2所示，一些基于稀疏3D体素的方法需要较少的参数来实现与基于投影的方法相同的分割性能。为了解决这个问题，一些基于2D投影的方法添加了三维后处理步骤，这可以提高分割性能，但也会导致运行时间延迟[13]，因此表征维度和坐标系的选择对表征能力至关重要。当与平移不变操作结合时，不同的坐标系也提供不同的不变性，极坐标还是笛卡尔坐标最适合表示能力尚不完全清楚。然而，最近的结果表明，将极坐标表示和笛卡尔表示相结合可能会带来额外的好处，以受益于旋转和平移的不变性（见表2中的底部行）。

当使用具有多个激光雷达传感器的车辆设置时，还应仔细考虑所选坐标系的坐标原点和光栅化分辨率，这对于球面范围图像投影和其它极坐标系尤其如此。正交因素（如损失函数和数据增强）也已被证明能够以较少的推理时间成本为表征能力带来可衡量的益处[41，20，35，32]。因此，仍需要进行未来的工作，以便将点云表示的表示能力从其训练方法中分离出来。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

实时车载激光雷达感知的点云深度学习

你可能感兴趣的:(人工智能,深度学习,人工智能)