AI算法后丹修炼炉

CVPR2020-探索图像识别中的自注意力

本文首先说明自注意力可以作为图像识别模型的基本组成部分。然后旨在探索自注意的变体并评估其对图像识别的有效性。重点考虑两种形式的自注意力：一个是pairwise自注意力，它主要对标准点积的注意力进行改进，从根本上讲是一个集合运算符；另一个是patchwise自注意力，它比卷积网络的性能更好。本文提出的pairwise自注意力网络匹配或优于它们相应的卷积网络，而patchwise模型则明显优于卷积基线。同时作者进行一些实验以探讨子注意力对表示学习的鲁棒性，得出结论：自注意力网络在鲁棒性和泛化性方面可能有很大潜力。

1.引言

卷积网络彻底改变了计算机视觉。在2012年的ImageNet数据集上实现突破性的准确性，大大超越了所有现有方法，并开创了计算机视觉的深度学习时代。随后的架构的改进产生了更大的规模以及用于图像识别的更精确的卷积网络，如GoogLeNet，VGG，ResNet，DenseNet等。这些体系结构又可以用作计算机视觉及其他应用程序的模板。

从LeNet开始，所有网络基本上都基于离散卷积。离散的卷积运算符∗可以定义如下：

其中F是一个离散函数，k是一个离散滤波器。卷积的一个关键特征是它的平移不变性：在图像F上应用相同的滤波器k。尽管在现代图像识别中，卷积是基本算子，但它并非没有缺点。卷积缺少旋转不变性。学习的参数量随内核k空间的增加而增加。滤波器的平稳性可以看作是一个缺点：来自相邻感受野的信息聚合无法适应其内容。在图像识别模型的设计空间中，基于离散卷积的网络是否有可能是局部最优的？设计空间的其他部分能否产生具有有趣新功能的模型？

最近的工作表明自注意力机制可以构成图像识别模型的可行选择。自注意运算符已在自然语言处理中采用。在计算机视觉中自注意力体系结构的发展正在逐渐发现与卷积网络具有不同甚至互补性质的模型。

这项工作探索了自注意力算子的各种形式，评估了它们作为图像识别模型的基本组成部分的有效性。主要探索两种类型的自注意力：首先是pairwise自注意力，它改进了自然语言处理中使用的标准点积注意力；patchwise与卷积不同，它基本上是一个集合运算符，而不是序列运算符。与卷积不同，它不会将固定权重附加到特定位置（等式（1）中的s）。一个结果是可以增加自注意力算符的footprint（例如，从3×3到7×7补丁），或者使其变得不规则，而不会影响参数的数量。本文在保持这些不变性的同时提出了许多变体，pairwise注意力比点乘注意力具有更强的表达能力。特别是权重计算不会使通道尺寸崩溃，并允许特征聚合适应每个通道。

接下来探索另一类运算符，称其为patch wise自注意力。其像卷积一样，具有唯一标识其footprint内特定位置的能力。它们没有pairwise注意力的排列或基数不变性，但比卷积更严格更强大。

实验表明，两种形式的自注意力对于建立图像识别模型都是有效的。构建可以直接与ResNet模型进行比较的自注意网络，并在ImageNet数据集上进行实验。pairwise自注意力网络在参数和FLOP预算相近或更低的情况下，与卷积对等网络相比性能更优。对照实验还表明矢量算符胜过标准的标量注意力。此外，patchwise模型大大优于卷积基线。例如中型SAN15具有出色的注意力性能，胜过更大的ResNet50，SAN15的top-1精度为78％，而ResNet50的精度为76.9％，参数和FLOP计数降低了37％。得出结论，自注意力网络在鲁棒性和泛化性方面具有更好的优势。

2.Self-attention Networks

在用于图像识别的卷积网络中，网络的各层执行两项功能：首先是特征聚合，卷积操作通过组合内核提取的所有位置的特征来执行；第二个功能是特征变换，它是通过连续的线性映射和非线性标量函数执行的：这些连续的映射和非线性运算破坏了特征空间并产生了复杂的分段映射。

本文构建的基础之一是，这两个功能（特征聚合和特征转换）可以分离。如果具有执行特征聚合的机制，则可以通过分别处理每个特征向量（针对每个像素）的感知器层来执行特征转换。感知器层由线性映射和非线性标量函数组成：逐点操作执行特征变换。因此构建的重点在于特征聚合。

卷积运算符通过固定内核执行特征聚合，该内核应用预训练的权重来线性组合一组附近位置的特征值。权重是固定的不适合特征的内容。而且由于每个位置都必须使用专用的权重向量进行处理，因此参数的数量与聚合要素的数量呈线性比例关系。本文提出了许多替代性的聚合方案，并构建了高性能的交错功能聚合（通过自注意力）和功能转换（通过elementwise感知器）的图像识别架构，。

2.1 Pairwise Self-attention

两种类型的自注意力。第一种，pairwise，具有以下形式：

其中 $\odot$ 表示Hadmard乘积，i表示特征向量 $x_i$ 的空间索引（即特征图的位置）， $R (i)$ 表示聚合的局部footprint。footprint $R (i)$ 是一组索引，用于指定聚合哪些特征向量以构造新特征 $y_i$

函数β生成特征向量 $β（x_j）$ ，这些特征向量由自适应权重向量 $α（x_i，x_j）$ 聚合。这个函数的可能实例化，以及围绕自注意力体系结构中的的特征转换元素，将在后面讨论。

函数α用于组合变换后的特征 $β（x_j）$ 的权重 $α（x_i，x_j）$ 。为了简化对不同形式的自注意力的阐述，将α分解如下：

关系函数δ输出表示特征 $x_i$ 和 $x_j$ 的单个矢量。然后函数γ将此向量映射到一个向量，可以将其与 $β（x_j）$ 组合，如等式2所示。

函数γ能够探索关系δ，该关系产生的维数可变的矢量不必与 $β（x_j）$ 的维数匹配。它还可以将其他可训练的变换引入权重 $α（x_i，x_j）$ 的构造中，从而使这种构造更具表现力。此函数执行线性映射，然后执行非线性操作，然后执行另一个线性映射。即，γ= {Linear→ReLU→Linear}。γ的输出维数不必与β的维数匹配，因为可以在一组通道之间共享注意力权重。

探索关系函数δ的多种形式：

ϕ和ψ是可训练的变换，例如线性映射，并且具有匹配的输出维数。通过求和，减法和Hadamard乘积， $δ（x_i，x_j）$ 的维数与变换函数的维数相同。通过串联， $δ（x_i，x_j）$ 的维数将加倍。对于点积， $δ（x_i，x_j）$ 的维数为1。

位置编码 pairwise注意力的一个显着特征是特征向量 $x_j$ 被独立处理，并且权重计算 $α（x_i，x_j）$ 不能合并来自i和j以外任何位置的信息。为了给模型提供一些空间背景，本文增加了具有位置信息的特征图。该位置编码如下。沿特征图的水平和垂直坐标首先在每个维度上标准化为[-1，1]范围。然后将这些标准化的二维坐标传递到可训练的线性层，该层可以将它们映射到适当的范围内的网络中的每一层。该线性映射为特征图中的每个位置i输出二维位置特征 $p_i$ 。对于每对（i，j）使得 $j \in R （ i ）$ ，通过计算差 $p_i -p_j$ 对相对位置信息进行编码。在映射γ之前串联 $p_i-p_j]$ 来增加 $δ（x_i，x_j）$ 的输出。

2.2 Patchwise Self-attention

另一种类型的自注意力为patchwise，其形式如下：

其中 $x_{R（i）}$ 是足迹R（i）中特征向量的patch。$ α（x_{R（i）}） $是与 p a t c h$ x_{R（i）}$具有相同空间维数的张量。 $ α（x_{R（i）}）j $是此张量中位置 j 处的向量，在空间上与$ x{R（i）} $中的向量$ x_j$相对应。

在patchwise自注意力中，构造应用于 $β（x_j）$ 的权重向量，以引用和合并来自footprint $R （ i ）$ 中所有特征向量的信息。与pairwise自注意力不同，patchwise自注意力不再是针对特征 $x_j$ 的设置操作。它不是置换不变或基数不变的：权重计算$ α（x_{R（i）}） $可以按位置分别索引特征向量$ x_j$，并且可以混合来自footprint内不同位置的特征向量的信息。因此，patchwise自注意力比卷积更严格更强大。

将$ α（x_{R（i）}）$分解如下：

函数γ将由 $δ（x_{R（i）}）$ 生成的向量映射到适当维数的张量。该张量包括所有位置j的权重向量。函数δ组合了来自block $x_{R（i）}$ 的特征向量 $x_j$ 。探索这种组合的以下形式：

2.3 Self-attention Block

上面描述的自注意力操作可以用来构造执行特征聚合和特征转换的残差块。自注意模块如图1所示。输入特征张量（通道维数C）通过两个处理流。左流通过计算函数δ（通过映射ϕ和ψ）和随后的映射γ来评估注意力权重α。右流使用线性变换β来变换输入特征并降低其维数以进行有效处理。然后，两个流的输出通过Hadamard产品进行聚合。合并后的特征经过归一化和elementwise非线性，然后由最终的线性层处理，该线性层将其维数扩展回C。

图 1 自注意力的block。 C是通道维数。左流评估注意力权重α，右流评估通过线性映射β变换特征。两种流都减少有效处理的通道维数。输出的流通过Hadamard乘积聚合，并且维数随后扩展回C。

2.4 Network Architectures

网络体系结构遵循残留网络，将其用作基线。表1列出了通过以不同分辨率堆叠自注意力块而获得的三种体系结构。这些体系结构（SAN10，SAN15和SAN19）与ResNet26，ResNet38和ResNet50大致对应。 SANX中的数字X表示自注意力blocks的数量。这里的体系结构完全基于自注意力。

表 1

backbone SAN的骨干网有五个阶段，每个阶段具有不同的空间分辨率，因此分辨率降低系数为32。每个阶段都包含多个自注意力block。连续的阶段由降低空间分辨率并扩大通道维数的过渡层桥接。最后阶段的输出由分类层处理，它包括全局平均池，线性层和softmax。

Transition 过渡层降低了空间分辨率，从而减少了计算负担并扩大了感受野范围。过渡包括批处理归一化层，ReLU，步幅为2的2×2 max池化以及扩展通道维数的线性映射。

Footprint of self-attention 局部足迹 $R （ i ）$ 控制自注意运算符从前一特征层收集的上下文的数量。将SAN的最后四个阶段的footprint设置为7×7。在第一阶段的footprint设置为3×3，这是因为该阶段的高分辨率以及内存消耗。增加footprint大小不会影响pairwise自注意力的参数数量。

Instantiations 可以调整每个阶段中的自注意力block的数量，以获得具有不同容量的网络。在表1所示的网络中，在最后四个阶段中使用的自注意力block的数量分别与ResNet26，ResNet38和ResNet50中的剩余block的数量相同。

3 Comparison

本节将第2节中介绍的自注意运算符系列与其他构造相关，包括卷积和标量注意力。表2总结了两种构造之间的一些差异。这些将在下面更详细地讨论。

Convolution 常规卷积运算符固定了与图像内容无关的内核权重。它不适用于输入内容。内核权重可能会因通道而异。

Scalar attention 在transformer和计算机视觉中的相关结构中使用的标量注意力通常具有以下形式：

（可以添加softmax和其他形式的标准化。）与卷积不同，聚合权重可以在不同位置变化，具体取决于图像的内容。另一方面，权重 $ϕ（x_i）^Tψ（x_j）$ 是在所有通道之间共享的标量。（Hu et al探索了点积的替代方法，但是这些替代方法在标量权重上运行，这些标量权重同样在通道之间共享。）这种构造无法适应不同通道上的注意力权重。尽管可以通过引入multihead在某种程度上缓解这种情况，但head的数量是一个很小的常数，标量权重由一个head 内的所有通道共享。

Han Hu, Zheng Zhang, Zhenda Xie, and Stephen Lin. Local
relation networks for image recognition. In ICCV, 2019.

Vector attention (本文提出的) 在第2节中介绍的运算符包含标量注意力。首先，在pairwise注意力系列中，关系函数δ可以产生矢量输出。求和，减法，Hadamard和串联形式就是这种情况。然后可以对该向量进行进一步处理，通过γ将其映射到正确的维数，而γ也可以将位置编码通道作为输入。映射γ产生具有与变换后的特征β兼容的维数的向量。这使结构在适应不同的关系函数和辅助输入时具有极大的灵活性，由于多重线性映射和沿着计算图的非线性而具有的强大的表达能力，能够产生沿空间和通道维度变化的注意力权重，并且由于该能力而具有的通过映射γ和β来降低维数的计算效率。

patchwise运算符系列在保留参数和FLOP效率的同时对卷积进行了改进。该系列操作符为沿特征图的所有位置生成权重向量，权重向量也沿通道维数变化。权重向量由算法的全部footprint告知。

4 Experiments

4.1 Implementation

从头开始训练所有模型100个epoch。使用余弦学习速率表，基础学习速率为0.1。在ImageNet上应用标准数据增强，包括对224×224块进行随机裁剪，随机水平翻转和归一化。在8个GPU上使用最小批大小为256的同步SGD。使用系数为0.1的标签平滑正则化。动量和权重衰减分别设置为0.9和1e-4。

卷积网络基线是ResNet26，ResNet38和ResNet50。 ResNet38和ResNet26是通过以ResNet50为起点并从每个阶段中删除一个或两个剩余的块来构造的。对于自注意力模块，默认情况下使用r1 = 16和r2 = 4（表示法见图1）。共享相同关注权重的通道数设置为8。

4.2 Comparison to Convolutional Networks

表3报告了本文提出的自注意力网络与卷积对等网络的主要比较结果。对于pairwise的自注意力使用减法关系。对于patch wise自注意力使用串联。这些决定基于下面的controled experiment。 pairwise模型匹配或优于卷积基线，具有相似或较低的参数和FLOP预算。patch wise模型的性能更好。例如，patch wise SAN10不仅优于ResNet26，而且优于ResNet38，与后者相比，其参数数量减少了40％，FLOP数量减少了41％。同样，patch wiseSAN15不仅优于ResNet38，而且优于ResNet50（SAN15的top-1精度为78％，而ResNet38的为76％，ResNet50的为76.9％），参数计数降低了37％，FLOP计数降低了37％。

表 3

4.3 Controlled Experiments

Relation function 表4报告了val-split集合上不同关系函数的受控比较结果。对于pairwise的自注意力。求和，减法和Hadamard乘积可以达到类似的精度。这些关系函数的性能优于串联和点积。实验表明向量自注意力优于标量自注意力。对于patch wise 的自注意力，串联可以达到更高的水平。精度高于star-product和clique-product。

表 4

同时也试图与Ramachandran等人提出的自我注意力配置进行对照比较。还有许多细微的差异会影响结果，从输入stem的配置到位置编码，再到体系结构超参数，再到数据扩充和训练计划。本文试图通过使用相同的整体网络体系结构（SAN10）来尽可能地控制无关的差异和训练设置。在此框架内复制了Ramachandran等人的自注意力模块。本文使用了他们的分组点积注意力，添加了位置信息，并将r1和r2（瓶颈尺寸减小因子）设置为4。这产生的top-1准确度为71.7％，top-5的准确度为89.9％，低于本文在相同设置下的自注意力配置，也低于Ramachandran的结果。（参数数量为13.9M，FLOP数量为2.3G。）结合本文的受控实验，有以下结论：向量自注意力是计算机视觉中自注意力网络的基本构建基块。patchwise的自注意值得进一步研究。

Prajit Ramachandran, Niki Parmar, Ashish Vaswani, Irwan
Bello, Anselm Levskaya, and Jonathon Shlens. Stand-alone
self-attention in vision models. In NeurIPS, 2019.

Mapping function 对注意力映射函数γ中的线性层数进行消融研究。结果列于表5。对于pairwise模型，使用两个线性层产生最高的精度。对于patch wise模型，不同的设置将产生相似的精度。
在patch wise设置中，只有一层用于注意力映射的线性层会增加内存和计算成本。多层可以引入瓶颈，从而降低维度，内存和计算成本。本文使用两个线性层（表5中的中间设置）作为所有模型的默认值。

表 5

Transformation functions 评估使用三个不同的变换函数（ϕ，ψ和β）是否有帮助。结果在表6中。使用三个不同的可学习转换通常是最佳选择。另一个优点是，独特的β转换可使用不同的瓶颈尺寸减小因子r1和r2，这些可用于降低FLOP消耗。

表 6

Footprint size 评估自注意力footprint R（i）大小的影响。结果在表7。在卷积网络中，较大的
占用空间会增加内存和计算成本。在自注意力网络中，准确性最初会随着内核空间的大小而增加，然后达到饱和。对于pairwise 自注意力，增加footprint大小不会影响参数的数量。考虑到所有因素，将所有模型的默认尺寸设置为7×7。

表 7

Position encoding 最后评估pairwise自注意中位置编码的重要性。结果在表8。位置编码具有显著作用。如果不使用位置编码，则top-1精度下降5个百分点。绝对位置编码比没有位置编码要好，但是准确性仍然很低。

表 8

4.4 Robustness

进行了两个实验，以探索与卷积基线相比，自注意力网络学习表示的鲁棒性。

Zero-shot generalization to rotated images 第一个实验在旋转和翻转的图片下测试经过训练的网络。在此实验中，来自val原始集的ImageNet图像以以下四种方式之一旋转和翻转：顺时针90°，顺时针180°，顺时针270°和上下翻转沿水平轴的方向。这是小样本测试：训练时未进行此类操作。结果记录在表9中。本文的假设是，pairwise的自注意力基本上是一个集合算子，因此pairwise的自注意模型比卷积网络（或patch wise自注意）对这种操纵更为健壮。当图像将其旋转180°， pairwise SAN19的性能下降18.9个百分点，比ResNet50的下降低5.1个百分点。pairwise SAN10模型在这种情况下达到了54.7％的top-1准确度。

表 9

5 Conclusion

本文探索完全基于自注意力的图像识别模型的有效性。考虑了两种形式的自注意力：pairwise和patch wise。pairwise形式是集合操作，在这方面与卷积有根本不同。 patch wise形式是卷积的一般化。对于这两种形式都引入向量注意力，可以有效地在空间维度和通道上调整权重。

本文的实验得出了许多重要结论。首先，基于pairwise自注意力的网络匹配或优于卷积基线。
这表明深度学习在计算机视觉中的成功并非与卷积网络密不可分：还有另一种选择，具有不同或潜在有益的结构特性（例如排列和基数不变）的可比较或更高的判别能力的途径。第二个结论是， patch wise自注意力模型的性能明显优于卷积基线。表明广义卷积的 patch wise自注意力可能会在计算机视觉中的各个应用程序中获得很高的准确性。最后实验表明，向量自注意力很强大，并且大大胜过标量（点积）注意力。

论文https://hszhao.github.io/papers/cvpr20_san.pdf

代码 https://github.com/hszhao/SAN
AI算法后丹修炼炉是一个由各大高校以及一线公司的算法工程师组建的算法与论文阅读分享组织。我们不定期分享最新论文，资讯，算法解析，以及开源项目介绍等。欢迎大家关注，转发，点赞。同时也欢迎大家来平台投稿，投稿请添加下方小助手微信。

QQ交流群：216912253

查看更多交流方式

微信公众号：AI算法后丹修炼炉

小助手ID：jintianandmerry

深度学习｜表示学习｜卷积神经网络｜由参数共享引出的特征图｜08 漂亮_大男孩表示学习深度学习学习 cnn
如是我闻：FeatureMap（特征图）的概念与ParameterSharing（参数共享）密切相关。换句话说，参数共享是生成FeatureMap的基础。FeatureMap是卷积操作的核心产物，而卷积操作的高效性正是由参数共享带来的。下面我们详细看一下FeatureMap和ParameterSharing之间的关系：1.什么是FeatureMap？定义：FeatureMap是卷积操作生成的输出结
JVM基础：什么是STW？我心向阳iu #JVM Java面试知识点精讲 jvm java 面试
今天笔试题，出了个STW，咱是见也没见过，漏了怯了无语，仔细回忆了下，知道Stop-The-World这个词，不知道SWT，无语文章目录STW：Stop-The-WorldSTW概念进入SWT时机STW停顿的原因STW示例代码STW：Stop-The-WorldSTW概念STW(Stop-The-World):是在垃圾回收算法执行过程当中，将JVM内存冻结、应用程序停顿的⼀种状态。一旦Stop-t
草稿随笔1 weixin_42811974 python
fromselenium.webdriver.common.byimportByfromtest_appium.page.BasePage1importBasePageimporttimefromselenium.webdriver.support.uiimportWebDriverWaitfromselenium.webdriver.supportimportexpected_condition
ollama部署及实践记录,虚拟环境，pycharm等 PyAIGCMaster 我买了个服务器 pycharm linux ide
我的环境：ubutu24.050.相关命令kt@kt4028:~/myproject/ollama-linux$ollama--helpLargelanguagemodelrunnerUsage:ollama[flags]ollama[command]AvailableCommands:serveStartollamacreateCreateamodelfromaModelfileshowShow
移动应用开发技术架构图彭乙肱
移动应用相关视频讲解：AIGC和微信的辅助学习移动应用开发技术架构图移动应用开发技术架构图是移动应用程序员必备的工具之一。它展示了一个应用程序的各个部分如何相互交互，以及它们之间的关系。在这篇文章中，我们将简要介绍移动应用开发技术架构图的基本概念，并使用代码示例来说明其重要性。架构图的重要性移动应用开发技术架构图对于理解一个应用程序的整体设计和功能至关重要。它可以帮助开发人员更好地组织代码，减少代
洛谷P1106 删数问题 ThE.wHIte. 算法 c++贪心算法
题目描述输入一个高精度的正整数n（长度不大于240位），去掉其中任意s个数字后剩下的数字按原左右次序将组成一个新的正整数，现求一种方案，使得新的正整数数值最小。输入第一行一个整数n。第二行一个正整数s。输出输出一个数表示最小值，输出时忽略数字的前导零。样例输入11795664样例输出115样例输入29030713样例输出21本题很明显应该采用贪心算法解题，问题在于贪心策略的选择。这道题令人迷惑的点
JVM中的STW和CMS Modify_QmQ #JVM jvm stw cms
STWJava中Stop-The-World机制简称STW，是在执行垃圾收集算法时，Java应用程序的其他所有线程都被挂起（除了垃圾收集帮助器之外）。Java中一种全局暂停现象，全局停顿，所有Java代码停止，native代码可以执行，但不能与JVM交互；这些现象多半是由于gc引起。GC时的StoptheWorld(STW)是大家最大的敌人。但可能很多人还不清楚，除了GC，JVM下还会发生停顿现象
为什么 TCP 挥手需要有 TIME_WAIT 状态？ qq_39279448 tcp/ip 网络网络协议
在TCP协议里，连接关闭过程需精确处理。TCP借助四次挥手（four-wayhandshake）实现从建立连接到断开连接，而在四次挥手最后阶段，TCP协议会进入特殊的TIME_WAIT状态，此步骤对确保可靠的连接断开意义重大。本文将深入探讨设置TIME_WAIT状态的原因及其在TCP协议中的作用。一、四次挥手和TIME_WAIT状态概述TCP连接关闭时，客户端和服务器会执行四次挥手：第一次挥手：主
深入理解 Vue 的 Diff 算法：从原理到实现的完整剖析 qq_39279448 vue.js 算法前端
Vue的Diff算法如何工作？如何将传统树的比较复杂度从O(n^3)降到O(n)？Vue3的优化策略如何显著提升性能？Vue源码中Diff算法的实现细节是什么？实际开发中Diff算法的使用及优化实践。1.Diff算法的基本原理1.1为什么需要Diff算法？在浏览器中，直接操作真实DOM会导致：性能成本高：DOM是浏览器中的重量级对象，频繁操作会触发页面的回流（reflow）和重绘（repaint）
数据挖掘中的关联规则--面向频繁项集的A-Priori算法绒绒毛毛雨大数据挖掘算法数据挖掘 python
文章目录一、频繁项集与关联规则学习1.实体与关系2.支持度与频繁项集3.关联规则二、寻找频繁项集1.频繁项集发现的挑战三角矩阵项对计数值的三元组存储方法2.频繁项集的单调性3.面向项对的A-Priori算法4.PCY算法哈希表创建第二遍扫描5、多阶段算法6、多哈希算法7、随机化算法8、SON算法9、Toivonen算法三、频繁项集小实践：消费者购买记录模拟数据示例具体问题分析一、频繁项集与关联规则
全网最最实用--教你用gradio搭网页、部署模型等（代码粘贴即用、不讲虚的）绒绒毛毛雨大模型算法 microsoft 前端语言模型人工智能 ai
文章目录〇前言一、构建网页1.各个组件介绍a.文本输入和输出b.图像输入和输出c.音频输入和输出d.视频输入和输出e.文件上传和下载f.滑块(`Slider`)g.单选按钮(`Radio`)h.复选框(`CheckboxGroup`)j.数据表格(`Dataframe`)2.一个网页示例代码a.按钮使用指南（事件处理和回调）3.整个网页代码b.整个网页展示二、构建ai任务a.构建一个自己的大语言模
Python:实现similarity search相似性搜索算法(附完整源码) 源代码大师 python算法完整教程 python 机器学习
Python:实现similaritysearch相似性搜索算法from__future__importannotationsimportmathimportnumpyasnpdefeuclidean(input_a:np.ndarray,input_b:np.ndarray)->
探秘FreeMovie：一个开源的电影推荐系统孟振优Harvester
探秘FreeMovie：一个开源的电影推荐系统去发现同类优质开源项目:https://gitcode.com/项目简介是一个基于深度学习的开源电影推荐系统，由pojiezhiyuanjun开发并维护。该项目的目标是为用户提供个性化的电影推荐服务，通过机器学习算法理解用户的观影偏好，并据此进行智能推荐。技术分析FreeMovie的核心架构包括以下关键组件：数据处理-项目采用Hadoop进行大数据预处
『大模型笔记』AI自动化编程工具汇总[持续更新ING]！ AI大模型前沿研究大模型笔记大模型 AI自动化工具 bolt.new Cursor V0
『大模型笔记』AI自动化编程工具汇总！文章目录一.Bolt.new(开源AI驱动全栈Web开发工具)1.1.Bolt.new介绍1.2.编程小白如何打造自己的导航网站二.Cursor(人工智能代码编辑器)2.1.Cursor入门教程2.2.Cursor左侧布局设置和VSCode一样2.3.Cursor效率之道：Agent模式＋7大高级技巧详解三.Windsurf(颠覆Cursor的全新工具)3.1
龙珠训练营机器学习task04 a_little_pig_ python
学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容，学习链接为：https://tianchi.aliyun.com/competition/entrance/231702/introduction?spm=5176.20222472.J_3678908510.8.8f5e67c2RKrT98总体思路：分别使用LightGBM，xgboost，gbdt，catboost建立多个个体学习器（加入b
关于Java中的导包 SherlockWZX Java java
导包//静态导入包~importstaticjava.lang.Math.random;importstaticjava.lang.Math.PI;publicclassTest{publicstaticvoidmain(String[]args){System.out.println(random());//可以直接使用random方法System.out.println(PI);//可以直接使
使用 Railway 和 Supabase 零成本搭建 n8n 自动化平台小二上酒8 自动化系统架构运维 java 开发语言
在前文使用自动化工作流聚合信息摄入和输出中，我介绍了如何在NAS提供的Docker环境安装n8n，以及n8nworkflow的使用方式。经过3个月的使用，我有了一些新的体会和尝试，重新设计了n8n的部署方案。本文将对这套新的方案进行说明，并分享数据迁移和第三方服务接入的实践。系统架构系统架构图我们所要搭建的这套服务有着如图所示的系统关系。Cloudflare:CDN和Proxy，用于加速网站访问，
“大模型横扫千军”背后的大数据挖掘--浅谈MapReduce 绒绒毛毛雨大数据挖掘数据挖掘 mapreduce 人工智能
文章目录O背景知识1数据挖掘2邦费罗尼原则3TF.IDF4哈希函数5分布式文件系统一、MapReduce基本介绍1.Map任务2.按键分组3.Reduce任务4.节点失效处理5.小测验：在一个大型语料库上有100个map任务和若干reduce任务：二、基于MapReduce的基本运算1.选择（Selection）2.交（Intersection）3.并（Union）4.补（Difference）5
【贪心算法】洛谷P1106 - 删数问题仟濹算法学习笔记贪心算法算法 c语言 c++
2025-01-22-第46篇【洛谷】贪心算法题单-【贪心算法】-【学习笔记】作者(Author):郑龙浩/仟濹(CSND账号名)目录文章目录目录P1106删数问题题目描述输入格式输出格式样例#1样例输入#1样例输出#1提示思路代码P1106删数问题题目描述键盘输入一个高精度的正整数nnn（不超过250250250位），去掉其中任意kkk个数字后剩下的数字按原左右次序将组成一个新的非负整数。编程对
1.7K star！AI Cover：开源的红包封面[特殊字符]生成器，赶快收藏！前端后花园前端热门开源项目人工智能 github javascript 开发语言前端代码片段
欢迎来到前端后花园！我们专注分享前端开源项目，目标是探索分享精选100个高质量的开源项目。这是系列的第3篇文章，分享一个AI红包封面生成开源项目。大家好，我是小前！想要制作一款红包封面？却不懂PS，没关系，小前今天分享的开源项目-AI红包封面生成，输入提示词（eg.蛇年快乐）即可生成符合设计规范的红包封面，快来看看吧！简介AICover是一款开源的红包封面生成器，输入要生成的红包描述，即可快速生成
golang-实现自己的事件驱动小屋子大侠服务端 golang
golang实现自己的事件驱动众所周知，go中的异步操作都已经封装在了运行时的过程中，有关socket的网络的异步操作都封装到了go的netpoll中，从而简化了编程形式。本文也就根据evio库总结而来。golang跨平台库如何编写golang的跨平台库，现在主流的方式如下：evserver│go.mod│main.go│└───show││show.go││show_darwin.go││sho
Topaz Video AI——视频修复爱研究的小牛 AIGC—视频 AIGC
一、TopazVideoAI介绍及使用TopazVideoAI是一款基于人工智能的视频增强和修复软件，主要用于提升视频质量、去噪、插帧和分辨率提升。它利用深度学习技术对视频进行智能化处理，使得视频看起来更加清晰和流畅。TopazVideoAI特别适合那些需要修复旧视频、提升低分辨率视频质量的用户。二、TopazVideoAI的主要功能视频去噪：通过AI模型去除视频中的噪点，使画面更加干净。分辨率提
性能测试了解服务架构吾爱乐享性能测试 tomcat 服务架构
软件架构与部署性能测试软件服务架构一般分为，最外层lvs-nginx-tomcat-redis-mysqlmermaidgraphLRlvs-->nginx主1-->tomcat1-->redis1-->mysql1nginx主1-->tomcat2-->redis1lvs-->nginx主2-->tomcat3-->redis2-->mysql2nginx主2-->tomcat4-->redis
dfs专题五：FloodFill算法 lisanndesu 算法深度优先
1.图像渲染link:733.图像渲染-力扣（LeetCode）codeclassSolution{public:intprev;vector>floodFill(vector>&image,intsr,intsc,intcolor){if(image[sr][sc]==color)returnimage;prev=image[sr][sc];dfs(image,sr,sc,color);retu
【C语言】预处理详解星霜旅人 c语言
他们想要逃避工作的压迫，却又被功绩社会深植的价值观绑架。预定义符号1.C语言设置了⼀些预定义符号，可以直接使用，预定义符号也是在预处理期间处理的。1__FILE__//进⾏编译的源⽂件2__LINE__//⽂件当前的⾏号3__DATE__//⽂件被编译的⽇期4__TIME__//⽂件被编译的时间5__STDC__//如果编译器遵循ANSIC，其值为1，否则未定义#includeintmain(){
【C++】初学者的浪漫编程指南星霜旅人 C++c++
少年不惧岁月长，彼方尚有荣光在。前言这是我自己学习C++的第一篇博客总结。后期我会继续把C++学习笔记开源至博客上。C++的兼容性1.C++兼容绝大多数C语言的语法，因此只需要把.c后缀文件改为.cpp即可。2.VS编译器看到是.cpp就会调用C++编译器编译。#define_CRT_SECURE_NO_WARNINGS#includeintmain(){printf("helloworld\n"
贪吃蛇游戏（代码篇）星霜旅人项目代码 c语言开发语言游戏
我们并不是为了满足别人的期待而活着。前言这是我自己做的第五个小项目---贪吃蛇游戏（代码篇）。后期我会继续制作其他小项目并开源至博客上。上一小项目是贪吃蛇游戏（必备知识篇），没看过的同学可以去看看：有关贪吃蛇必备知识的小项目https://blog.csdn.net/hsy1603914691/article/details/142455297?sharetype=blogdetail&share
命令中心(Command Center) 开源项目指南宁烈廷
命令中心(CommandCenter)开源项目指南commandcenterStarcraftAIBot项目地址:https://gitcode.com/gh_mirrors/co/commandcenter项目介绍命令中心是一款由DaveChurchill开发的开源工具，旨在提供一个集中化的任务管理和执行平台。它允许开发者和系统管理员便捷地调度、监控和管理各种命令或脚本任务，支持跨平台操作，极大
RPA真的是人工智能吗？微刻时光 RPA加油站 rpa 人工智能
1.RPA与AI的定义与区别1.1RPA的定义与特点机器人流程自动化（RoboticProcessAutomation，简称RPA）是一种软件技术，它通过模拟人类用户的操作行为来自动执行重复性、基于规则的任务。RPA的核心特点包括：非侵入性：RPA作为外挂工具部署在客户现有系统上，不影响原有IT基础架构。基于规则的操作：RPA流程必须有明确的、可被数字化的触发指令和输入，不允许出现无法提前定义的例
基于大语言模型构建本地个人AI助理由数入道人工智能语言模型自然语言处理
在构建本地专属的个人AI助理时，我们需要处理多个方面的技术需求，确保其在多模态数据处理、实时查询、灵活推理、知识图谱更新等方面具备高效性、实时性和可扩展性。以下探讨如何基于大语言模型构建一个具备全面功能的个人AI助理，涵盖知识库管理、动态推理、用户交互、实时学习和跨模态集成等关键技术。一、技术设计总体架构1.目标与需求个性化AI助理：构建一个本地专属AI助理，能够处理多种输入格式（文本、图像、音频
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方