fish小余儿

PointNeXt: Revisiting PointNet++ with Improved Training and Scaling Strategies

Abstract

PointNet++ 是点云理解领域最有影响力的神经网络架构之一。虽然近期出现了 PointMLP 和 Point Transformer 等新型网络，它们的精度已经大大超过了 PointNet++，但我们发现大部分性能提升是由于改进的训练策略，例如数据增强和优化技术以及增加的模型大小，而不是由于架构创新。因此，PointNet++ 的全部潜力尚未被充分发掘。在本研究中，我们通过系统性的模型训练和缩放策略对经典的 PointNet++ 进行了重新审视，并提出了两个主要贡献。首先，我们提出了一组改进的训练策略，显著提高了 PointNet++ 的性能。例如，我们展示了在不改变架构的情况下，PointNet++ 在 ScanObjectNN 对象分类任务上的整体准确率（OA）可以从 $77.9$ 提高到 $86.1$ ，甚至超过了最先进的 PointMLP。其次，我们将倒置残差瓶颈设计和可分离 MLP 引入到 PointNet++ 中，实现了高效和有效的模型缩放，并提出了 PointNeXt，即 PointNets 的下一版本。PointNeXt 可以灵活地进行扩展，并在 3D 分类和分割任务上优于最先进的方法。在分类任务中，PointNeXt 在 ScanObjectNN 上达到了 $87.7$ 的整体准确率，比 PointMLP 高 $2.3$ ，并且推理速度是其 $10$ 倍。在语义分割任务中，PointNeXt 在 S3DIS 上实现了新的最先进性能，均值 IoU 达到 $74.9$ （6 折交叉验证），优于最近的 Point Transformer。代码和模型可在 https://github.com/guochengqian/pointnext 上获取。

1 Introduction

近年来，三维数据采集技术的进步导致点云理解领域兴起了一股热潮。随着 PointNet [29] 和 PointNet++ [30] 的兴起，使用深度卷积神经网络处理未经结构化的点云数据成为了可能。在 “PointNets” 之后，许多基于点云的网络被引入，其中大部分专注于开发新的、精密的模块来提取局部结构，如 KPConv 中的伪网格卷积 [43] 和 Point Transformer 中的自注意力层 [56]。这些新提出的方法在各种任务中都大幅优于 PointNet++，给人留下了 PointNet++ 架构过于简单、难以学习复杂的点云表示的印象。在本研究中，我们重新审视了经典且广泛使用的 PointNet++ 网络，并发现它的全部潜力尚未被充分发掘，主要原因是 PointNet++ 时代缺少了两个因素：（1）更优秀的训练策略和（2）有效的模型缩放策略。

通过对各种基准测试的全面实证研究，例如用于对象分类的ScanObjecNN [44]和用于语义分割的S3DIS [1]，我们发现训练策略，即数据增强和优化技术，在网络性能中起着重要作用。事实上，现有最先进（SOTA）方法 $[46, 43, 56]$ 相对于PointNet++ [30]的性能提升很大程度上是由于改进的训练策略，不幸的是，与体系结构的变化相比，这些策略不太被人所知。例如，训练过程中随机丢弃颜色可以意外地提高PointNet++在S3DIS [1]上的测试性能 $5.9$ 平均交并比（mIoU），如表5所示。此外，采用标签平滑[39]可以将ScanObjectNN [44]的整体准确度（OA）提高 $1.3$ 。这些发现激励我们重新审视PointNet++并为其配备今天广泛使用的新高级训练策略。令人惊讶的是，如图1所示，仅利用改进的训练策略就将PointNet++的OA在ScanObjectNN上提高了 $8.2$ （从 $77.9$ 提高到 $86.1$ ），在不引入任何架构更改的情况下建立了新的SOTA（详见第4.4.1节）。对于S3DIS分割基准测试，通过6倍交叉验证在所有区域评估的mIoU可以增加 $13.6$ （从 $54.5$ 提高到 $68.1$ ），超越了许多在PointNet++之后的现代架构，例如PointCNN [22]和DeepGCN [21]。

图1：训练策略和模型扩展对PointNet++[30]的影响。我们展示了改进的训练策略（数据增强和优化技术）和模型扩展可以显著提高PointNet++的性能。我们在ScanObjectNN [44]和S3DIS [1]上报告平均的整体精度和mIoU（6倍交叉验证）。

此外，我们观察到目前用于点云分析的主流模型 $[20, 43, 56]$ 比最初的 PointNets $[29, 30]$ 使用了更多的参数。有效地将 PointNet++ 从原来的小规模扩展到大规模是值得研究的一个主题，因为更大的模型通常能够实现更丰富的表示并表现更好 $[2, 19, 55]$ 。然而，我们发现在 PointNet++ 中简单地使用更多的构建块或增加通道大小只会导致延迟的增加，而不会显著提高准确性（请参见第 4.4.2 节）。为了实现有效和高效的模型扩展，我们将残差连接 [13]、反向瓶颈设计 [36] 和可分离的 MLPs [32] 引入到 PointNet++ 中。现代化的架构被命名为 PointNeXt，是 PointNets 的下一个版本。PointNeXt 可以灵活扩展，并在各种基准测试中优于 SOTA。正如图 1 所示，PointNeXt 在 S3DIS [1] 6-fold 上将原始的 PointNet++ 提高了 $20.4$ 的 mIoU（从 $54.5$ 提高到 $74.9$ ），并在 ScanObjecNN [44] 上实现了 $9.8$ 的 OA 增益，超过了 SOTA 的 Point Transformer [56] 和 PointMLP [28]。我们接下来总结我们的贡献：

我们首次对点云领域的训练策略进行了系统研究，并表明仅仅采用改进的训练策略就能使PointNet++在ScanObjectNN上的OA增加8.2%，在S3DIS上的mIoU增加13.6%，PointNet++在这些任务上成功反击了。这些改进的训练策略具有普适性，可以轻松应用于改进其他方法[29, 46, 28]。
我们提出了PointNeXt，PointNets的下一个版本。PointNeXt具有可扩展性，超过了所有研究任务的SOTA，包括对象分类[44, 49]，语义分割[1, 5]和部分分割[53]，同时在推理速度方面也优于SOTA。

2 Preliminary: A Review of PointNet++

我们的PointNeXt是基于PointNet++ [30]构建的，它使用了类似U-Net [35]的编码器和解码器结构，如图2所示。编码器部分使用一系列集合抽象（SA）块，以分层方式对点云特征进行抽象；而解码器通过相同数量的特征传播块逐步插值抽象的特征。SA块包括一个下采样层以降采样输入点，一个分组层以查询每个点的邻居，一组共享的多层感知机（MLPs）以提取特征，以及一个减少层以在邻居内聚合特征。分组层、MLPs和减少层的组合形式为：
$\mathbf{x}_i^{l+1}=\mathcal{R}_{j:(i, j) \in \mathcal{N}}\left\{h_{\boldsymbol{\Theta}}\left(\left[\mathbf{x}_j^l ; \mathbf{p}_j^l-\mathbf{p}_i^l\right]\right)\right\} \tag1$

其中， $\mathcal{R}$ 是缩减层（例如最大池化层），用于聚合点 $i$ 的邻居特征，表示为 $\in \mathcal{N}}$ 。 $\mathbf{p}_i^l, \mathbf{x}_i^l, \mathbf{x}j^l$ 分别是网络第 $l$ 层中输入坐标、输入特征和邻居 $j$ 的特征。 $h{\Theta}$ 表示共享的 MLP，将 $\mathbf{x}_j^l$ 和相对坐标 $\left(\mathbf{p}_j^l-\mathbf{p}_i^l\right)$ 的连接作为输入。需要注意的是，由于使用单尺度分组的 PointNet++ 是原论文中使用的默认架构，即每个阶段使用一个 SA 块，因此我们在整个论文中都将其称为 PointNet++ 并将其用作我们的基线。

3 Methodology: From PointNet++ to PointNeXt

在本节中，我们介绍了如何将经典架构PointNet++[30]现代化为具有SOTA性能的下一代PointNet++：PointNeXt。我们的研究主要集中在两个方面：（1）现代化的训练方法，以改进数据增强和优化技术，以及（2）现代化的架构，以探究感受野的缩放和模型的缩放。这两个方面都对模型的性能有重要影响，但以前的研究还没有很好地探讨这些问题。

3.1 Training Modernization: PointNet++ Strikes Back

我们进行了系统性研究，量化了现代点云网络（ $[46, 43, 56]$ ）使用的每种数据增强和优化技术的影响，并提出了一组改进的训练策略。采用我们提出的训练策略可以揭示出 PointNet++ 的潜力。

3.1.1 Data Augmentation

数据增强是提高神经网络性能的最重要策略之一，因此我们从那里开始进行现代化。原始的PointNet ++在各种基准测试中使用了随机旋转、缩放、平移和抖动的简单数据增强组合[30]。近期的方法采用比PointNet++中使用的更强的增强策略。例如，KPConv [43] 在训练期间随机丢弃颜色，Point-BERT [54] 使用常见的点重采样策略从原始点云中随机采样1024个点进行数据缩放，而RandLA-Net [15]和Point Transformer [56]在分割任务中将整个场景作为输入。在本文中，我们通过添加性研究量化了每种数据增强的效果。

我们从PointNet++ [30]作为基线开始我们的研究，该基线使用原始的数据增强和优化技术进行训练。我们逐个移除每个数据增强以检查其是否必要。我们添加回有用的增强但移除不必要的增强。然后，我们系统地研究了代表性工作 [46, 43, 32, 56, 28, 54] 中使用的所有数据增强，包括数据缩放，如点重采样[54]和将整个场景加载为输入[15]，随机旋转、随机缩放、平移以移动点云、抖动以为每个点添加独立噪声、高度附加[43]（即将沿物体重力方向的每个点的测量附加为附加输入特征）、自动对比度调整颜色对比度[56]和颜色随机丢弃，将颜色随机替换为零值。我们逐步验证数据增强的有效性，并仅保留提供更好验证准确性的增强。在此研究的结尾，我们提供了每个任务的数据增强集合，以实现模型性能的最大提升。第4.4.1节详细介绍和分析了发现的结果。

3.1.2 Optimization Techniques

优化技术包括损失函数、优化器、学习率调度器和超参数，对神经网络的性能也至关重要。 PointNet++ 在其实验中使用相同的优化技术：CrossEntropy 损失函数，Adam 优化器 [16]，指数学习率衰减（Step Decay）和相同的超参数。由于机器学习理论的发展，现代神经网络可以使用理论上更好的优化器（例如AdamW [27] v s Adam [16]）和更高级的损失函数（具有标签平滑的CrossEntropy [39]）。类似于我们对数据增强的研究，我们还量化了每种现代优化技术对 PointNet++ 的影响。我们首先对学习率和权重衰减进行顺序超参数搜索。然后，我们对标签平滑、优化器和学习率调度器进行了逐步研究。我们发现了一组改进的优化技术，进一步提高了性能。总的来说，带有标签平滑的CrossEntropy、AdamW和Cosine Decay可以在各种任务中相对优化模型的表现。有关详细结果，请参见第4.4.1节。

图2：PointNeXt架构。PointNeXt与PointNet++ [30]共享相同的Set Abstraction和Feature Propagation块，同时在开头添加了一个额外的MLP层，并使用提出的倒置残差MLP（InvResMLP）块来扩展架构。

3.2 Architecture Modernization: Small Modifications → Big Improvement

在这个小节中，我们将 PointNet++ [30] 现代化成提出的 PointNeXt。这个现代化包含两个方面：（1）感受野尺度的缩放和（2）模型尺度的缩放。

3.2.1 Receptive Field Scaling

在神经网络设计空间中，感受野是一个重要的因素[38,7]。在点云处理中，至少有两种方法可以扩大感受野：（1）采用更大的半径来查询邻域，和（2）采用分层结构。由于分层结构已经被原始的PointNet++采用，因此我们主要在本小节中研究（1）。需要注意的是，PointNet++的半径设置为一个初始值 $r$ ，当点云下采样时翻倍。我们在每个基准测试中研究不同的初始值，发现半径是特定于数据集的，对性能有重大影响。这将在4.4.2节中详细阐述。

此外，我们发现方程（1）中的相对坐标 $\Delta_p = \mathbf{p}_j^l-\mathbf{p}_i^l$ 使网络优化更加困难，导致性能下降。因此，我们提出相对位置归一化（ $\Delta_p$ 归一化），将相对位置除以邻域查询半径：
$\mathbf{x}_i^{l+1}=\mathcal{R}_{j:(i, j) \in \mathcal{N}}\left\{h_{\boldsymbol{\Theta}}\left(\left[\mathbf{x}_j^l ;\left(\mathbf{p}_j^l-\mathbf{p}_i^l\right) / r^l\right]\right)\right\} . \tag2$

没有归一化时，相对位置的值（ $\Delta_p=\mathbf{p}_j^l-\mathbf{p}_i^l$ ）非常小（小于半径），需要网络学习更大的权重来应用于 $\Delta_p$ 。这使得优化变得非常困难，特别是由于使用了权重衰减以减少网络的权重，因此容易忽略相对位置的影响。所提出的归一化通过重新缩放来减轻了这个问题，并同时减少了不同阶段 $\Delta_p$ 的方差。

3.2.2 Model Scaling

PointNet++ 是一个相对较小的网络，在分类结构中编码器仅由 2 个阶段组成，而在分割中为 4 个阶段。每个阶段仅包含 1 个 SA 块，每个块包含 3 层 MLP。PointNet++ 的模型大小用于分类和分割都小于 $2$ M，这与通常使用超过 $10$ M 参数的现代网络相比要小得多。有趣的是，我们发现，即使附加更多的 SA 块或使用更多的通道，也不会导致明显的精度提高，而会导致吞吐量显著下降（请参见第 4.4.2 节），主要原因是梯度消失和过拟合。因此，在本小节中，我们研究如何有效且高效地扩展 PointNet++。

我们提出了反向残差多层感知机（InvResMLP）块，以实现有效和高效的模型扩展。在每个阶段的第一个SA块之后追加InvResMLP块，其结构如图2中间下方所示。InvResMLP与SA之间有三个不同之处。（1）添加了输入和输出之间的残差连接，以减轻梯度消失问题[13]，特别是当网络更深时。（2）引入可分离的MLP以减少计算量并增强点特征提取。尽管原始SA块中的所有3个MLP层都是在邻域特征上计算的，InvResMLP将MLP分成一层计算邻域特征（在分组和缩减层之间）和两层计算点特征（在缩减层之后），受MobileNet [14]和ASSANet [32]启发。（3）利用倒置瓶颈设计[36]将第二个MLP的输出通道扩展4倍，以丰富特征提取。追加InvResMLP块被证明可以显着提高性能，相比追加原始SA块而言（请参见第4.4.2节）。

此外，我们在宏观架构上提出了三个变化。 (1) 我们统一了 PointNet++ 分类和分割编码器的设计，即将分类的 SA 块数量从 2 扩展到 4，同时在每个阶段保持原始数量 (4 个块) 用于分割。 (2) 我们使用对称解码器，其通道大小改变以匹配编码器。 (3) 我们添加了一个 stem MLP，即一个额外的 MLP 层插入到架构的开头，将输入点云映射到更高的维度。

总之，我们提出了 PointNeXt，这是 PointNets $[29, 52]$ 的下一个版本，通过结合所提出的 InvResMLP 和上述的宏体系结构更改从 PointNet++ 进行修改。PointNeXt 的体系结构如图 2 所示。我们将 stem MLP 的通道大小表示为 $C$ ，InvResMLP 块的数量表示为 $B$ 。更大的 $C$ 导致网络的宽度增加（即宽度扩展），而更大的 $B$ 导致网络的深度增加（即深度扩展）。当 $B = 0$ 时，在每个阶段仅使用一个 SA 块和没有 InvResMLP 块。SA 块中 MLP 层数为 2，每个 SA 块内部添加一个残差连接。当 $\neq 0$ 时，在原始 SA 块后添加 InvResMLP 块。在这种情况下，SA 块中 MLP 层数设置为 1 以节省计算成本。我们的 PointNeXt 系列的配置如下所述：

PointNeXt-S: $C = 32, B = 0$
PointNeXt-L: $C = 32, B = (2, 4, 2, 2)$
PointNeXt-B: $C = 32, B = (1, 2, 1, 1)$
PointNeXt-XL: $C = 64, B = (3, 6, 3, 3)$

5 Related Work

点云方法直接使用点云的无结构格式进行处理，相比于基于体素的方法[10, 4]和基于多视图的方法[37, 12, 9]。点云网络(PointNet) [29] 是点云方法的先驱工作，通过限制特征提取为逐点方式，使用共享的MLP模型来建模点的置换不变性。点云网络++(PointNet++) [30] 的出现旨在提高PointNet的性能，以捕捉局部几何结构。目前，大多数基于点云的方法都专注于局部模块的设计。[46、45、31]采用图神经网络，[51、22、43、42]将点云投影到伪网格上，以允许进行规则卷积，[48、23、24]通过局部结构确定的权重自适应地聚合邻域特征。此外，最近的一些方法通过类似于Transformer的网络 $[56, 17]$ ，利用自注意力来提取局部信息。我们的工作不追随这种局部模块设计的趋势。相反，我们将注意力转移到另一个重要但鲜为人知的方面，即训练和扩展策略。

最近对于图像分类领域的训练策略已经得到了研究 $[2, 47, 26]$ 。在点云领域，SimpleView [9]是第一篇展示训练策略对神经网络性能有重要影响的工作。然而，SimpleView仅仅采用了与DGCNN [46]相同的训练策略。相反，我们进行了系统研究，以量化每种数据增强和优化技术的影响，并提出了一组改进的训练策略，可以提高PointNet++ [30]和其他代表性工作 $[29, 46, 28]$ 的性能。

模型扩展能够显著提高网络性能，这在各个领域的开创性工作中得到了证明 $[40, 55, 21]$ 。与使用少于 $2$ M参数的PointNet++ $[30]$ 相比，大多数当前流行的网络的参数超过了 $10$ M，例如KPConv $[43]$ (15M)和PointMLP $[28]$ (13M)。在我们的工作中，我们探索了一些有效且高效的PointNet++模型扩展策略。我们提供了实际建议，即使用残差连接和反向瓶颈设计来提高性能，同时使用可分离MLP来保持吞吐量。

6 Conclusion and Discussion

本文展示了通过改进训练和模型缩放策略，PointNet++的性能可以提高到超过当前的最新技术。具体而言，我们量化了每种数据增强和优化技术的效果，并提出了一组改进的训练策略。这些策略可以轻松应用于提高PointNet++和其他代表性作品的性能。我们还将反向残差MLP块引入PointNet++中以开发PointNeXt。我们展示了PointNeXt在各种基准测试中具有卓越的性能和可伸缩性，同时保持高吞吐量。本研究旨在引导研究人员更加关注训练和缩放策略的影响，并激励未来的研究朝这个方向发展。

Limitation. 虽然PointNeXt-XL是所有代表性基于点的网络[30、43、15、56]中最大的之一，但它的参数数量（44M）仍然低于图像分类中的小型网络，例如Swin-S [25]（50M）、ConNeXt-S [26]（50M）和ViT-B [8]（87M），并且远远低于它们的大型变体，包括Swin-L（197M）、ConvNeXt-XL（350M）和ViT-L（305M）。在这项工作中，我们没有进一步推动模型大小，主要是因为与更大的图像数据集（如ImageNet [6]）相比，点云数据集具有更小的规模。此外，由于重点不在引入新的架构变化上，因此我们的工作受到现有模块的限制。

论文链接：https://arxiv.org/pdf/2206.04670.pdf

笔记本电脑外接固态移动硬盘可以用于深度学习吗 Vertira pytorch 电脑深度学习智能电视
笔记本电脑外接固态移动硬盘可以用于深度学习‌。虽然外接固态移动硬盘的传输速度和内置固态硬盘相比有一定差距，但在现代技术下，外接固态移动硬盘的传输速度已经非常快，能够满足深度学习的需求。例如，USB3.2Gen2×2PSSD的传输速度可以达到2000MB/s，这对于深度学习来说已经足够‌12。具体应用场景和性能表现‌传输速度‌：现代外接固态移动硬盘，如USB3.2Gen2×2PSSD，传输速度可以达
使用OpenAI API实现自然语言处理应用 shuoac 自然语言处理人工智能 python
使用OpenAIAPI实现自然语言处理应用技术背景介绍随着人工智能技术的不断发展，自然语言处理（NLP）在各种应用中的地位越来越重要。从自动文本生成、聊天机器人到智能搜索引擎，NLP技术的应用场景非常广泛。而OpenAI提供的API使得开发者可以轻松地将先进的NLP模型集成到他们的应用中。核心原理解析OpenAI的API基于强大的GPT（GenerativePre-trainedTransform
长文本生成的“中间迷途”：当AI在信息洪流中迷失与觉醒步子哥 AGI通用人工智能人工智能
长文本生成的困境：当AI在信息洪流中迷失在人工智能领域，大型语言模型（LLM）如同拥有无限记忆的超级读者，能轻松消化整座图书馆的藏书。但当被要求撰写万字论文时，这些"博学者"往往只能产出不足两千字的短文——这就像让美食家品尝满汉全席后，只能复述前菜和甜点的味道。更令人困扰的是，当输入文本超过8000词时，模型会像在图书馆迷路的读者，对"中间书架"的内容视而不见，这种现象被形象地称为"中间丢失"（L
常见的点云数据的获取方式我是瓦力点云深度学习计算机视觉人工智能深度学习开发语言
1.激光雷达（LiDAR）获取方式：激光脉冲测距原理：激光雷达通过发射激光脉冲并接收反射信号来测量物体与传感器之间的距离。计算激光脉冲从发射到返回所需的时间，并将其转换为距离，从而生成三维点云数据。常用设备：车载激光雷达（如Velodyne、Ouster）无人机搭载激光雷达地面激光扫描仪（如Leica、Trimble）2.结构光扫描获取方式：投射光栅图案原理：结构光扫描仪向物体表面投射已知图案的光
PointNet++改进策略：模块改进 | x-Conv | PointCNN，结合局部结构与全局排列提升模型性能我是瓦力 PointNet++改进策略人工智能深度学习计算机视觉
目录前言PointCNN实现细节1.XXX-Conv操作输入输出步骤2.PointCNN网络架构层级卷积分类与分割任务3.数据增强4.效率优化前言这篇论文介绍了一种名为PointCNN的方法，旨在从点云（pointcloud）数据中学习特征。传统卷积神经网络（CNN）在处理规则网格数据（如图像）时非常有效，但由于点云是无序且不规则的，直接在其上应用卷积操作会导致形状信息丢失，并对点的排列顺序敏感。
人工智能学习星月IWJ 人工智能机器学习深度学习神经网络目标检测人工智能
//-----初探-----//人工智能三大核心要素数据/算法/算力人工智能是通过机器来模拟人类认知能力的技术机器学习/神经网络/深度学习(多层隐藏层神经网络)tf1.14python3.5keras2.1.5//-----数学基础&&数字图像-----//向量大小/方向矢量(有大小和方向)标量(只有大小没有方向(长度))单位向量线性变换(矩阵运算)T(v+w)=T(v)+T(w)T(cv)=cT
点云网络的论文理解（三）-点云网络的优化 PointNet++的总体说明 CUHK-SZ-relu PointNet 深度学习
总体说明这个部分是为了让大家可以更好地理解文章1.以前的网络有什么缺点1.首先第一点就是论文当中反复提到的没有局部特征的问题。2.另外一个就是PointNet不具有平移不变性，理解一下这个，PointNet最后是一个maxpooling所以决定是不是选择当前内容的唯一因素是大小，因为除了pooling之外使用的就只有mlp，之前的所有一系列处理其实都可以等价为乘上一个参数，每个的参数可能不同，有正
深度学习复习笔记（6）线性回归——新冠预测项目 Kriol 深度学习初学深度学习笔记线性回归
importmatplotlib.pyplotaspltimporttorch#框架importnumpyasnp#矩阵处理importcsv#读excel文件fromtorch.utils.dataimportDataLoader,Dataset#两个与数据处理相关的包，类Datasetimporttorch.nnasnn#类nn.Module需要用，损失函数需要用fromtorchimport
向量空间与范数 Shockang 机器学习数学通关指南人工智能机器学习数学线性代数
前言本文隶属于专栏《机器学习数学通关指南》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和参考文献请见《机器学习数学通关指南》ima知识库知识库广场搜索：知识库创建人机器学习@Shockang机器学习数学基础@Shockang深度学习@Shockang正文一、向量空间：机器学习的舞台1.1定义与核心要素️向量空间是机器学习的数学基础，它提供了描述和处理高
互信息详解 Shockang 机器学习数学通关指南机器学习人工智能数学信息论
前言本文隶属于专栏《机器学习数学通关指南》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和参考文献请见《机器学习数学通关指南》ima知识库知识库广场搜索：知识库创建人机器学习@Shockang机器学习数学基础@Shockang深度学习@Shockang正文互信息：变量间关联性的量化利器互信息(MutualInformation)是信息论中的核心概念，也是
QP 问题（Quadratic Programming, 二次规划） BineHello 算法人工智能强化学习自动驾驶线性代数
QP问题（QuadraticProgramming,二次规划）是什么？QP（QuadraticProgramming，二次规划）是一类优化问题，其中目标函数是二次型函数，约束条件可以是线性等式或不等式。QP问题是线性规划（LP，LinearProgramming）的扩展形式，广泛应用于最优控制、机器学习、金融优化、信号处理等领域。一、QP问题的数学定义标准形式的QP问题如下：min⁡x12xTQx
《自然语言处理实战入门》深度学习 ---- 预训练模型初探 shiter AI重制版】预训练 NLP 自然语言处理
文章大纲前言预训练模型简介语言表示学习神经上下文编码器为何需要预训练模型发展历史主流预训练模型预训练模型与分类将PTMs应用至下游任务微调策略未来研究方向参考文献前言随着深度学习的发展，各种神经网络被广泛用于解决自然语言处理(NLP)任务，如卷积神经网络(convolutionalneuralnetworks,CNNs)、递归神经网络(neuralnetworks,RNNs)、基于图的神经网络(g
【AI深度学习网络】Transformer时代，RNN（循环神经网络）为何仍是时序建模的“秘密武器”？ arbboter 人工智能 rnn 人工智能深度学习循环神经网络记忆序列数据循环连接
引言：什么是循环神经网络（RNN）？循环神经网络（RecurrentNeuralNetwork,RNN）是一种专门处理序列数据（如文本、语音、时间序列）的深度学习模型。与传统神经网络不同，RNN具有“记忆”能力，能够通过内部状态（隐藏状态）保留历史信息，从而捕捉序列中的时间依赖关系。在自然语言处理、语音识别、时间序列预测等领域，数据本质上是序列化的——即当前数据点与前后数据点存在依赖关系。传统的前
DeepSeek发展背景和前景爱吃苹果的日记本人工智能
1.成立背景：它的背景是由杭州深度求索人工智能基础技术研究有限公司开发，该公司成立于2023年7月17日，由量化资管巨头幻方量化创立。幻方量化在AI量化对冲基金领域具有深厚的技术积累和资金支持，这为DeepSeek的研发奠定了坚实的基础。2.技术演进：2024年1月：发布首个大模型DeepSeekLLM，包含670亿参数，在2万亿token的数据集上训练，性能超越Llama270BBase。202
《高效迁移学习：Keras与EfficientNet花卉分类项目全解析》机器学习司猫白深度学习迁移学习 keras 分类 tensorflow efficientnet 性能优化
从零到精通的迁移学习实战指南：以Keras和EfficientNet为例一、为什么我们需要迁移学习？1.1人类的学习智慧想象一下：如果一个已经会弹钢琴的人学习吉他，会比完全不懂音乐的人快得多。因为TA已经掌握了乐理知识、节奏感和手指灵活性，这些都可以迁移到新乐器的学习中。这正是迁移学习（TransferLearning）的核心思想——将已掌握的知识迁移到新任务中。1.2深度学习的困境与破局传统深度
多模态大模型：技术原理与实战模型压缩实战 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战模型压缩实战作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：多模态大模型，技术原理，模型压缩，实战，TensorFlow，PyTorch，模型压缩方法，应用场景1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，多模态大模型在图像识别、语音识别、自然语言处理等领域的应用越来越广泛。然而，多模态大模型通常具有庞大
无人机动态追踪技术难点与距离分析！云卓SKYDROID 无人机人工智能云卓科技智能跟踪吊舱
一、技术难点概述目标识别与跟踪算法的鲁棒性复杂场景适应性**：在动态背景（如人群、森林）或光照变化（逆光、夜间）下，算法需精准区分目标与干扰物。传统计算机视觉方法（如光流法、卡尔曼滤波）易受干扰，需结合深度学习（如YOLO、SiamRPN++）提升抗干扰能力。多目标跟踪与遮挡处理**：目标被遮挡或短暂消失时，需通过轨迹预测或特征匹配恢复跟踪，对算法的记忆能力和实时性要求极高。实时性要求**：算法需
第20周：Pytorch文本分类入门 weixin_46620278 pytorch 分类人工智能
目录前言一、前期准备1.1环境安装导入包1.2加载数据1.3构建词典1.4生成数据批次和迭代器二、准备模型2.1定义模型2.2定义示例2.3定义训练函数与评估函数三、训练模型3.1拆分数据集并运行模型3.2使用测试数据集评估模型总结前言本文为[365天深度学习训练营]中的学习记录博客原作者：[K同学啊]说在前面本周任务：了解文本分类的基本流程、学习常用数据清洗方法、学习如何使用jieba实现英文分
机器学习中的谱方法（Spectral Methods）与核方法（Kernel Methods） Cachel wood python机器学习和数据挖掘机器学习人工智能 django sklearn python 开发语言
文章目录机器学习中的谱方法（SpectralMethods）与核方法（KernelMethods）1.谱方法（SpectralMethods）核心思想关键技术示例：谱聚类2.核方法（KernelMethods）核心思想关键技术示例：核SVM3.谱方法与核方法的对比4.核心联系5.如何选择？6.总结机器学习中的谱方法（SpectralMethods）与核方法（KernelMethods）谱方法和核方
第N2周：构建词典 OreoCC NLP
本人往期文章可查阅：深度学习总结我的环境：语言环境：Python3.11编译器：PyCharm深度学习环境：Pytorchtorch==2.0.0+cu118torchvision==0.18.1+cu118显卡：NVIDIAGeForceGTX1660本周任务：使用N1周的.txt文件构建词典，停用词请自定义1.导入数据fromtorchtext.vocabimportbuild_vocab_f
第N3周：NLP中的数据集构建 OreoCC 自然语言处理深度学习 pytorch
本人往期文章可查阅：深度学习总结对于初学者，NLP中最烦人的问题之一就是数据集的构建问题，处理不好就会引起shape问题（各种由于shape错乱导致的问题）。这里我给出一个模板，大家可根据这个模板来构建。torch.utils.data是PyTorch中用于数据加载和预处理的模块。其中包括Dataset和DataLoader两个类，它们通常结合使用来加载和处理数据。1.Datasettorch.u
Pytorch 张量的scatter_add_方法介绍 qq_27390023 pytorch 人工智能 python
torch.Tensor.scatter_add_是PyTorch中的一个原地操作（in-placeoperation），用于将一个源张量（src）中的值根据指定的索引（index）累加到目标张量（self）中。它常用于分布式计算、加权聚合以及自定义深度学习层等场景。函数签名Tensor.scatter_add_(dim,index,src)→Tensor参数说明dim(int)：指定沿着哪个维度
NLP新手入门-第N1周：Pytorch文本分类入门 Oaix Nay 365天深度学习训练记录 pytorch 自然语言处理分类
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊|接辅导、项目定制目录一、课题背景和开发环境二、环境安装三、文本分类1.加载数据2.构建词典3.生成数据批次和迭代器4.定义模型5.定义实例6.定义训练函数与评估函数7.拆分数据集并运行模型8.使用测试数据集评估模型一、课题背景和开发环境第N1周：Pytorch文本分类入门Python3.8.12pytorch==1.8.1+cu111t
Unity引擎开发：2D与3D渲染技术_虚拟现实与增强现实技术 chenlz2007 游戏开发2 unity 3d vr lucene 游戏引擎材质 ar
虚拟现实与增强现实技术在上一节中，我们探讨了Unity引擎中的光照和阴影处理技术，了解了如何通过不同的光照模型和阴影算法提升游戏的视觉效果。接下来，我们将进入虚拟现实（VR）和增强现实（AR）技术的世界，探讨如何在Unity引擎中实现这些技术，特别是在动作游戏中的应用。虚拟现实（VR）技术虚拟现实技术通过计算机生成的环境来模拟真实的或想象的场景，让用户能够沉浸其中。Unity引擎提供了强大的工具和
基于PyTorch的深度学习5—神经网络工具箱 Wis4e 深度学习 pytorch 神经网络
nn.Module是nn的一个核心数据结构，它可以是神经网络的某个层(Layer)，也可以是包含多层的神经网络。在实际使用中，最常见的做法是继承nn.Module，生成自己的网络/层。nn中已实现了绝大多数层，包括全连接层、损失层、激活层、卷积层、循环层等，这些层都是nn.Module的子类，能够自动检测到自己的Parameter，并将其作为学习参数，且针对GPU运行进行了cuDNN优化。nn中的
基于Pytorch深度学习——Softmax回归 EchoToMe 深度学习 pytorch 回归 python
本文章来源于对李沐动手深度学习代码以及原理的理解，并且由于李沐老师的代码能力很强，以及视频中讲解代码的部分较少，所以这里将代码进行尽量逐行详细解释并且由于pytorch的语法有些小伙伴可能并不熟悉，所以我们会采用逐行解释+小实验的方式来给大家解释代码大家都知道二分类问题我们在机器学习里面使用到的是逻辑回归这个算法，但是针对于多分类问题，我们常用的是Softmax技术，大家不要被这个名字给迷惑了，s
Python 在深度学习中的应用 2501_90435375 人工智能 python 深度学习开发语言
深度学习是机器学习的一个分支，它通过构建和训练深层神经网络来实现对数据的学习和理解。Python作为一种简洁、易读、功能强大的编程语言，在深度学习领域得到了广泛的应用。本文将详细介绍Python在深度学习中的应用，包括深度学习的基础概念、Python深度学习库和框架、实际案例。二、深度学习的基础概念1.神经网络神经网络是深度学习的基础，它由多个神经元组成，每个神经元接收输入信号，进行加权求和，并通
[Pytorch报错问题解决]AttributeError: ‘nn.Sequential‘ object has no attribute ‘append‘ Bartender_Jill 编程报错解决 pytorch 人工智能 python
问题运行深度学习代码的时候遇到了以下报错问题：Traceback(mostrecentcalllast):File"/home/anaconda3/envs/Text2HOI/lib/python3.9/site-packages/torch/autograd/grad_mode.py",line28,indecorate_contextreturnfunc(*args,**kwargs)File
Python 快速入门指南 2501_90435375 Python python 开发语言
Python入门指南1.Python是什么Python是一种高级编程语言，具有简单易学、代码可读性强、功能强大、语法优雅等特点。它被广泛应用于Web开发、数据分析、人工智能、自动化脚本、游戏开发等领域。2.Python的特点简单易学Python的语法设计简洁明了，代码可读性强，易于学习和理解。例如，print("Hello,World!")就能输出“Hello,World!”，无需复杂的环境配置或
基于PyTorch的深度学习——机器学习1 Wis4e 深度学习机器学习 pytorch
监督学习是最常见的一种机器学习类型，其任务的特点就是给定学习目标，这个学习目标又称标签、标注或实际值等，整个学习过程就是围绕如何使预测与目标更接近而来的。近些年，随着深度学习的发展，分类除传统的二分类、多分类、多标签分类之外，也出现了一些新内容，如目标检测、目标识别、图像分割等监督学习的重要内容半监督学习是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据，同时由部分使用标记
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS