MJ5513

Beyond Self-attention: External Attention usingTwo Linear Layers for Visual Tasks（论文翻译）

摘要

注意机制，尤其是自我注意，在视觉任务的深度特征表示中发挥了越来越重要的作用。自注意力通过使用所有位置的成对亲和力计算特征的加权和来更新每个位置的特征，以捕获单个样本中的长期依赖关系。然而，self-attention 具有二次复杂度，并且忽略了不同样本之间的潜在相关性。本文提出了一种新的注意力机制，我们称之为外部注意力，它基于两个外部的、小的、可学习的、共享的内存，只需使用两个级联的线性层和两个归一化层就可以轻松实现；它方便地取代了现有流行架构中的 self-attention。外部注意力具有线性复杂性，并隐含考虑所有数据样本之间的相关性。我们进一步将多头机制纳入外部注意，以提供用于图像分类的全 MLP 架构，外部注意 MLP (EAMLP)。在图像分类、对象检测、语义分割、实例分割、图像生成和点云分析方面的大量实验表明，我们的方法提供的结果与自我注意机制及其一些变体相当或更好，而且计算和内存成本要低得多.

1.引言

由于self-attention 机制有助于提高在各种自然语言处理 [1]、[2] 和计算机视觉 [3]、[4] 任务中捕获远程依赖关系的能力。自注意力通过聚合单个样本中所有其他位置的特征来细化每个位置的表示，这导致样本中位置数量的二次计算复杂度。因此，一些变体试图以较低的计算成本来逼近 self-attention [5]、[6]、[7]、[8]。

此外，自注意力集中在单个样本内不同位置之间的自亲和性上，而忽略了与其他样本的潜在相关性。很容易看出，合并不同样本之间的相关性有助于更好地表示特征。例如，属于同一类别但分布在不同样本中的特征应该在语义分割任务中得到一致的处理，类似的观察适用于图像分类和其他各种视觉任务。

本文提出了一种新的轻量级注意力机制，我们称之为外部注意力（见图 1c））。如图 1a) 所示，计算自注意力需要首先通过计算自查询向量和自键向量之间的亲和度来计算注意力图，然后通过使用该注意力图对自值向量进行加权来生成新的特征图。外部注意力的作用不同。我们首先通过计算自查询向量和外部可学习键存储器之间的亲和力来计算注意力图，然后通过将此注意力图乘以另一个外部可学习值记忆产生一个定义的特征图。

图1.自我关注与外部关注

实际上，这两个存储器是用线性层实现的，因此可以通过端到端的反向传播来优化。它们独立于单个样本，在整个数据集中共享，起到很强的正则化作用，提高了注意力机制的泛化能力。外部注意力轻量级的关键在于内存中的元素数量远小于输入特征中的数量，从而产生与输入元素数量成线性关系的计算复杂度。外部存储器旨在学习整个数据集中最具辨别力的特征，捕获信息量最大的部分，并排除来自其他样本的干扰信息。在稀疏编码 [9] 或字典学习 [10] 中可以找到类似的想法。然而，与那些方法不同的是，我们既不尝试重建输入特征，也不对注意力图应用任何显式稀疏正则化。

尽管提出的外部注意方法很简单，但它对各种视觉任务都很有效。由于其简单性，它可以很容易地整合到现有流行的基于自我注意的架构中，例如 DANet [4]、SAGAN [11] 和 T2T-Transformer [12]。图 3 展示了一个典型的架构，用我们的外部注意力代替自我注意力来完成图像语义分割任务。我们在分类、对象检测、语义分割、实例分割和生成等基本视觉任务上进行了广泛的实验，具有不同的输入模式（图像和点云）。结果表明，我们的方法取得了与原始的自我注意机制及其一些变体，计算成本要低得多。

为了学习相同输入的不同方面，我们将多头机构结合到外部注意力以提升其能力。得益于提出的多头外部关注，我们设计了一种新颖的全MLP结构EAMLP，它可以与CNN和原始Transformers相媲美，用于图像分类任务。

本文的主要贡献概括如下：

一种新的注意机制--外部注意，其复杂性为O(N)；它可以取代现有体系结构中的自我注意。它可以在整个数据集中挖掘潜在的关系，具有很强的规则化作用，并提高了注意机制的泛化能力。
多头外部关注，这有利于我们构建一个全MLP架构；在ImageNet-1K数据集上实现了79.4%的TOP1准确率。
利用外部注意力进行图像分类、对象检测、语义分割、实例分割、图像生成、点云分类和点云分割的大量实验。在必须保持较低计算工作量的情况下，它比原始的自我注意机制及其一些变体获得了更好的结果。

2.相关工作

由于对注意机制的全面回顾超出了本文的范围，我们只讨论视觉领域中最密切相关的文献。

2.1 视觉任务中的注意机制

注意机制可以被视为一种根据激活的重要性重新分配资源的机制。它在人类视觉系统中扮演着重要的角色。在过去十年中，这一领域得到了蓬勃发展[3]、[13]、[14]、[15]、[16]、[17]、[18]。Hu等人提出了SENET[15]，证明了注意力机制可以减少噪声，提高分类性能。随后，许多其他论文将其应用于视觉任务。Wang等人提出了用于视频理解的非本地网络[3]，Hu等人[19]将注意力用于目标检测，Fu等人提出了用于语义切分的Danet[4]，Zhang等人[11]证明了注意机制在图像生成中的有效性，以及谢等人的研究成果提出了用于点云处理的A-SCN[20]。

2.2 视觉任务中的自我注意

自我注意是注意力的一种特殊情况，许多文献[3]、[4]、[11]、[17]、[21]都研究了视觉的自我注意机制。自我注意的核心思想是计算特征之间的亲和度，以获取长期依赖关系。然而，随着特征图大小的增加，计算和内存开销呈二次曲线增加。为了降低计算和内存成本，Huang等[5]提出了CRISP交叉关注，它依次考虑行关注和列关注来捕捉全局环境。Li等[6]采用期望最大化（EM）聚类来优化自我关注。Yuan等[7]提出使用对象-情境向量来处理注意力；然而，它依赖于语义标签。耿爽等人[8]表明在语义分割和图像生成中，矩阵分解是对全局上下文建模的一种更好的方法。其他工作[22]、[23]也探索了通过使用自我注意机制来提取局部信息。

与自我注意不同，自我注意通过计算自我查询和自我关键字之间的亲和度来获得注意图，而我们的外部注意计算自我查询和更小的可学习关键字记忆之间的关系，后者捕获数据集的全局上下文。外部注意力不依赖于语义信息，可以通过端到端的反向传播算法进行优化，而不需要迭代算法。

2.3 视觉任务中的transformer

基于transformer的模型在自然语言处理方面取得了巨大的成功[1]、[2]、[16]、[24]、[25]、[26]、[27]。最近，它们还展示了视觉任务的巨大潜力。Carion等人[28]提出了一种端到端的检测transformer，以CNN特征为输入，利用transformer生成包围盒。Dosovitski[18]提出了基于补丁编码和transformer的VIT，表明在有足够的训练数据的情况下，transformer提供了比传统CNN更好的性能。Chen等人[29]提出了一种基于transformer的IGPT图像生成方法。

随后，transformer方法已成功地应用于许多视觉任务，包括图像分类[12]、[30]、[31]、[32]、对象检测[33]、低级视觉[34]、语义分割[35]、跟踪[36]、视频实例分割[37]、图像生成[38]、多模式学习[39]、对象重新识别[40]、图像字幕[41]、点云学习[42]和自监督学习[43]。读者可以参考最近的调查[44]，[45]，以更全面地回顾视觉任务中transformer方法的使用。

3.方法

在这一部分中，我们从分析最初的自我注意机制入手。然后，我们详细介绍了我们定义注意力的新颖方式：外部关注。如后面的算法1所示，只需使用两个线性层和两个归一化层就可以很容易地实现它。

3.1 自注意力与外部注意力

我们首先回顾一下自我注意机制(见图1a)。给定输入特征映射F∈RN×d，其中N是元素(或图像中的像素)的数量，d是特征维度的数量，自关注将输入线性地投影到查询矩阵Q∈RN×d0、关键字矩阵K∈RN×d0和值矩阵V∈RN×d[16]。那么，自我关注可以用以下公式来表示：

其中 A∈RN×N 是注意矩阵，αi;j 是第 i 个和第 j 个元素之间（相似度）的成对相似度。

自注意力的一个常见简化变体（图 1b））直接从输入特征 F 计算注意力图，使用：

这里，注意力图是通过计算特征空间中的像素级相似度得到的，输出是输入的细化特征表示。

然而，即使在简化时，O(dN2) 的高计算复杂度也给使用自注意力带来了明显的缺点。输入像素数量的二次复杂性使得将自注意力直接应用于图像是不可行的。因此，以前的工作 [18] 利用补丁而不是像素上的自注意力来减少计算工作量。

自注意力可以被视为使用自我值的线性组合来细化输入特征。然而，在这种线性组合中，我们真的需要 N × N 自注意力矩阵和一个 N 元素自值矩阵，这一点远非显而易见。此外，self-attention 只考虑数据样本中元素之间的关系，而忽略了不同样本中元素之间的潜在关系，这可能会限制 self-attention 的能力和灵活性。

因此，我们提出了一个新的注意力模块，称为外部注意力，它通过以下方式计算输入像素和外部存储单元 M∈RS×d 之间的注意力：

与self-attention不同，式（5）中的αi,j是M的第i个像素和第j行的相似度，其中M是一个独立于输入的可学习参数，充当整体的记忆训练数据集。 A 是从这个学习到的数据集级先验知识推断出的注意力图；它以类似于自我注意的方式进行归一化（参见第 3.2 节）。最后，我们通过 A 中的相似性来更新 M 中的输入特征。

在实践中，我们使用两个不同的内存单元 Mk 和 Mv 作为键和值，以增加网络的能力。这稍微改变了外部注意力的计算

外部注意力的计算复杂度是O(dSN)；由于 d 和 S 是超参数，所提出的算法在像素数上是线性的。事实上，我们发现一个小 S，例如64，在实验中效果很好。因此，外部注意力比自我注意力更有效，可以直接应用于大规模输入。我们还注意到，外部注意力的计算负载大致相当于一个 1×1 的卷积。

3.2 归一化

在 self-attention 中使用 Softmax 对注意力图进行归一化，使得 Pj αi;j = 1。然而，注意力图是通过矩阵乘法计算的。与余弦相似度不同，注意力图对输入特征的规模敏感。为了避免这个问题，我们选择了[42]中提出的双重归一化，分别归一化列和行。这种双重归一化被表述为：

算法 1 中列出了用于外部注意力的 python 样式的伪代码。

3.3 多头外部注意力

在 Transformer [16] 中，self-attention 在不同的输入通道上计算多次，称为多头注意力。多头注意力可以捕获令牌之间的不同关系，从而提高单头注意力的能力。我们对多头外部注意力使用类似的方法，如算法 2 和图 2 所示。

图 2. 多头 self-attention 和 multi-head external-attention

多头外部注意力可以写成：

其中hi是第i个头，H是头的数量，Wo是一个线性变换矩阵，使输入和输出的维度保持一致。Mk∈RS×d 和 Mv∈RS×d 是不同头的共享内存单元。

这种架构的灵活性使我们能够在共享存储单元中在头部 H 的数量和元素 S 的数量之间取得平衡。例如，我们可以将 H 乘以 k，同时将 S 除以 k。

4.实验

我们已经对图像分类、对象检测、语义分割、实例分割、图像生成、点云分类和点云分割任务进行了实验，以评估我们提出的外部注意方法的有效性。所有实验均使用 Jittor [86] 和/或 Pytorch [87] 深度学习框架实现。

4.1 消融实验

为了在我们的完整模型中验证提出的模块，我们在 PASCAL VOC 分割数据集 [88] 上进行了实验。图 3 描绘了用于消融研究的架构，它以 FCN [46] 作为特征主干。批量大小和总迭代次数分别设置为 12 和 30,000。我们关注记忆单元的数量、自我关注与外部关注、主干、归一化方法和主干的输出步幅。如表 1 所示，我们可以观察到在 Pascal VOC 数据集上，外部注意力比自我注意力提供了更好的准确度。选择合适数量的内存单元对结果质量很重要。归一化方法可以对外部注意力产生巨大的积极影响，并改善自我注意力。

图 3. 使用我们提出的外部注意力进行语义分割的 EANet 架构

表 1 PASCAL VOC val 集的消融研究。Norm：注意力中的归一化方法。 #S：内存单元中的元素数。 OS：主干的输出步幅。 FCN [46]：全卷积网络。 SA：自我关注。 EA：外部注意力。 DoubleNorm：归一化描述为等式 9

4.2 视觉分析

使用外部注意力进行分割的注意力图（见图3），和多头外部注意力进行分类（见4.3节）分别如图4图5所示。我们从层中的存储单元 Mk 中随机选择一行 Mki。然后通过计算 Mi k 对输入特征的注意力来描述注意力图。我们观察到学习的注意力图集中在有意义的对象或背景上，如图 4 所示。图 5 中的最后两行表明 Mk 的不同行关注不同的区域。多头external attention的每个head都可以不同程度地激活感兴趣区域，如图5所示，提高了表示外在注意的能力。

图 4 Pascal VOC 测试集上的注意力图和分割结果。从左到右：输入图像，注意力图 w.r.t.在外部存储器中选择三个条目，分割结果。

图 5. ImageNet 验证集上 EAMLP-14 最后一层的多头注意力图。左：输入图像其他：EAMLP-14 最后一层的 24 个头部注意力图，用于 ImageNet 验证集。最后两行：注意两行不同的 Mk 到图像块

4.3 图像分类

ImageNet-1K [89] 是一个广泛使用的图像分类数据集。我们用外部注意和多头外部注意替换了 T2T-ViT [12] 中的Performer [90] 和多头自我注意块。为了公平起见，其他超参数设置与 T2T-ViT 相同。表 2 中的实验结果表明，external attention 比 Performer [90] 取得了更好的结果，并且比 multi-head attention 的结果低了约 2%。我们发现多头机制对自我关注和外部关注都是必要的。我们还尝试了 MoCo V3 [43] 提出的策略，在 T2T-ViT 主干的 MLP 块（不是外部注意力块）中用 BatchNorm(BN) [92] 替换 LayerNorm(LN) [91]。我们观察到我们的 EAMLP-7 提高了 1%。
但是，它在我们的大型模型 EAMLP-14 和 EAMLP-19 中产生了失败的案例。

表 2 ImageNet 上的实验。 Top1：top1 精度。 EA：外部注意力。 MEA：多头外部注意力。 EAMLP：提出了所有的 MLP 架构。Failed：无法收敛。 EAMLP-BN：在 T2T-ViT 主干的 MLP 块（不是外部注意力块）中用 BN 替换 LN。

4.4 目标检测和实例分割

MS COCO 数据集 [93] 是对象检测和实例分割的流行基准。它包含来自 80 个类别的超过 200,000 张图像和超过 500,000 个带注释的对象实例。

MMDetection [47] 是一个广泛使用的对象检测和实例分割工具包。我们使用带有 RestNet-50 主干的 MMDetection 进行了对象检测和实例分割实验，应用于 COCO 数据集。我们只在 Resnet 第 4 阶段结束时添加了外部关注。结果在表 3 和表4 表明，外部注意力为对象检测和实例分割任务带来了 1% 的准确性提高。

表 3 COCO 对象检测数据集的实验。引用的结果来自[47]。盒子 AP：盒子平均精度

表 4 COCO 实例分割数据集的实验。引用的结果来自[47]。掩码 AP：掩码平均精度

4.5 语义分割

在本实验中，我们采用图 3 中的语义分割架构，将其称为 EANet，并将其应用于 Pascal VOC [88]、ADE20K [94] 和 cityscapes [95] 数据集。

Pascal VOC 包含 10,582 张用于训练的图像、1,449 张用于验证的图像和 1,456 张用于测试的图像。它有 20 个前景对象类和一个用于分割的背景类。对于所有比较的方法，我们使用输出步幅为 8 的扩张 ResNet-101 作为主干；它在 ImageNet-1K 上进行了预训练。训练期间采用了多学习率策略。初始学习率、批量大小和输入大小设置为 0.009、16 和 513 × 513。我们首先在训练集上训练 45k 次迭代，然后在 trainval 集上微调 15k 次迭代。最后，我们在测试集上使用了多尺度和翻转测试。视觉结果如图 4 所示，定量结果在表 5 中给出：我们的方法可以达到与最先进的方法相当的性能。

表 5 与无 COCO 预训练的 PASCAL VOC 测试集上最先进方法的比较。

ADE20K 是一个更具挑战性的数据集，包含 150 个类别，以及分别用于训练、验证和测试的 20K、2K 和 3K 图像。我们采用输出步幅为 8 的扩张 ResNet-101 作为主干。实验配置与 mmsegmentation [60] 相同，训练 ADE20K 进行 160k 次迭代。表 6 中的结果表明，我们的方法在 ADE20K 验证集上优于其他方法。

Cityscapes 包含 19 个语义类别中的 5,000 个高质量像素级精细注释标签，用于城市场景理解。每张图像为 1024×2048 像素。它分为 2975、500 和 1525 张图像用于训练、验证和测试。（它还包含 20,000 张粗略注释的图像，我们没有在实验中使用）。我们采用输出步幅为 8 的扩张 ResNet-101 作为所有方法的主干。实验配置再次与 mmsegmentation 相同，以 80k 次迭代训练城市景观。表 7 中的结果表明，我们的方法在城市景观验证集上取得了与最先进的方法（即 DANet [4]）相当的结果。

4.6 图像生成

自注意力通常用于图像生成，其中一种代表性方法是 SAGAN [11]。我们用生成器和鉴别器中的外部注意方法替换了 SAGAN 中的自我注意机制，以获得我们的 EAGAN 模型。所有实验均基于流行的 PyTorch-StudioGAN 存储库 [96]。超参数使用 SAGAN 的默认配置。我们使用 Frechet 初始距离 (FID) [97] 和初始分数 (IS) [98] 作为我们的评估指标。一些生成的图像如图 6 所示，定量结果在选项卡中给出。 8 和 9：外部注意力提供了比 SAGAN 和其他一些 GAN 更好的结果。

4.7 点云分类

ModelNet40 [99] 是一个流行的 3D 形状分类基准，包含 40 个类别的 12,311 个 CAD 模型。
它有 9,843 个训练样本和 2,468 个测试样本。我们的 EAT 模型替换了 PCT [42] 中的所有自注意力模块。我们在每个形状上采样了 1024 个点，并按照 PCT [42] 通过随机平移、各向异性缩放和 dropout 来增强输入。表 11 表明我们的方法优于所有其他方法，包括其他基于注意力的方法，如 PCT。我们提出的方法为 2D 和 3D 视觉提供了出色的骨干。

4.8 点云分割

我们在 ShapeNet 零件数据集 [100] 上进行了点云分割实验。它在训练集中有 14,006 个 3D 模型，在评估集中有 2,874 个。每个形状都被分割成部分，共有 16 个对象类别和 50 个部分标签。我们遵循 PCT [42] 中的实验设置。 EAT 在这个数据集上取得了最好的结果，如表 10 所示。

4.9 计算要求

相对于输入大小的线性复杂度在效率方面带来了显着优势。我们在输入大小为 1 × 512 × 128 × 128 的参数数量和推理操作方面，将外部注意 (EA) 模块与标准自我注意 (SA) [16] 及其几个变体进行了比较，结果如表 12 所示。外部注意力只需要自我注意力所需参数的一半，而且速度快 32 倍。与最佳变体相比，外部注意力仍然快两倍左右。

5.结论

本文介绍了外部注意，这是一种新颖的轻量级但有效的注意机制，可用于各种视觉任务。外部注意力中采用的两个外部存储单元可以看作是整个数据集的字典，能够为输入学习更多具有代表性的特征，同时降低计算成本。我们希望外部关注能够激发实际应用和研究其在 NLP 等其他领域的应用

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

Beyond Self-attention: External Attention usingTwo Linear Layers for Visual Tasks（论文翻译）

你可能感兴趣的:(目标跟踪论文翻译,算法,人工智能,计算机视觉)