Laura_Wangzx

文献阅读（十七）：So-ViT: Mind Visual Tokens for Vision Transformer

摘要
1. Introduction
2. Related works
- Transformer in vision field
- Second-order pooling in CNN
3. Second-order ViT architecture
- 3.1. Architecture overview
- 3.2. Fusing class and visual tokens for classification 融合类和可视标记进行分类
- 3.3. Embedding of visual tokens嵌入可视标记
4. Normalization of cross-covariance matrix交叉协方差矩阵的标准化
- 4.1. Singular value power normalization奇异值功率归一化
- 4.2. Approximate, fast singular value power nor- malization近似，快速奇异值幂化
5. Experiments
- 5.1. Evaluation of the So-ViT architecture
- 5.2. Evaluation of svPN for second-order pooling
- 5.3. Comparison with T2T-ViT
- 5.4. Comparison with state of the art
6. Conclusion

原始ViT：
本文创新点：
ViT的骨干网完全由自注意力机制组成，但是性能在很大程度上取决于使用超大规模数据集进行的预训练，如果从头开始训练，它在ImageNet-1K上的性能将大大落后。本文通过利用视觉tokens，努力解决这个问题。
改进：具体在3.2节、3.3节、4节
分类head：现有的ViT利用class token，而完全忽略了高级visual token固有的丰富语义信息。——本文So-ViT：提出了一种新的分类范式，其中视觉标记的二阶交叉协方差池与class token结合在一起以进行最终分类。
图像patches：原始的ViT采用固定大小图像patches的naive embedding，缺乏对平移等方差和局部性进行建模的能力。——本文So-ViT：开发了一种基于现成卷积的轻量级分层模块，用于visual token embedding。

摘要

视觉转换(ViT)体系结构以纯粹的自注意机制为核心，在视觉分类领域取得了很好的效果。然而，原始ViT的高性能很大程度上依赖于使用超大数据集进行预处理，如果从头训练，它的性能明显低于ImageNet-1K。
本文通过仔细考虑可视化标记的作用，努力解决这一问题。
首先，对于分类头，现有的ViT只利用类标记，而完全忽略了高级视觉标记中固有的丰富语义信息。因此，我们提出了一种新的分类范式，将二阶交叉协方差池化的可视标记与类标记相结合进行最终分类。同时，提出了一种快速的奇异值幂归一化方法来改进二阶池。
第二，原ViT采用固定大小的图像小块的朴素嵌入，缺乏对平移等方差和局部化的建模能力。为了缓解这一问题，我们开发了一个轻量级的、基于现有卷积的分层模块来进行视觉标记嵌入。提出的体系结构(我们称之为So-ViT)在ImageNet-1K上进行了全面的评估。
广泛的结果显示，我们的模型，当从零开始训练时，优于竞争的ViT变量，同时与最先进的CNN模型持平或更好。

1. Introduction

在过去的几年里，人们在视觉识别、目标检测和语义分割等多种计算机视觉任务上取得了显著的进展。这一进展主要是由深度神经网络的重大进步推动的[19,1]，该网络通过一堆基本构建块来学习不同级别的特征。在计算机视觉中，卷积神经网络(CNN)[36, 13, 16]是支持从视觉识别到下游任务的主要架构。尽管CNN的架构已经有了很大的发展，但基本的构建块主要依赖于卷积[20]。

与CNN截然不同的是，与CNN截然不同的是，纯粹由注意机制组成的变形结构[39]在自然语言处理(NLP)方面取得了巨大的成功。注意机制能够自然地学习cnn所面临的长期依赖和全局情境，因此引起了视觉研究者越来越多的兴趣。然而，大多数视觉任务的方法集中于开发自我注意模块，插入到cnn的骨干以提高性能。直到最近，视觉变压器(ViT)[8]，它的主干是完全由一堆变压器块构建的，在视觉识别方面取得了令人印象深刻的性能。不幸的是，在ImageNet-1K数据集上，当在超大规模的ImageNet-21K或JFT-300M数据集上进行预训练时，ViT模型能够匹配或优于最先进的cnn，但如果从头开始训练[8]，则ViT模型的性能明显低于。
有几个原因可以解释这种较差的表现。ViT的分类范式遵循NLP[39]中常用的分类范式。也就是说，对于最终的分类，ViT只利用单个类标记，而完全忽略了可视化标记。我们认为高级块的视觉信息包含丰富的语义信息，有助于分类。此外，在ViT中，视觉标记通过固定大小的图像块的简单线性投影嵌入，然后主干总是学习生成的视觉标记序列的全局关系。因此，与CNN不同的是，ViT模型不包含层次结构，缺乏对翻译等方差和局部结构[8]的学习能力。

基于以上两个考虑，我们提出了一个新的ViT架构，通过修改其分类头和视觉标记的输入嵌入。对于分类头，我们提出二阶交叉协方差池视觉标记作为全局图像表示，并与类标记相结合进行最终分类。同时，我们设计了一个轻量级的分层模块，由一个主干和一个有效嵌入视觉标记的阶段组成。然后，视觉标记嵌入到标准视觉转换器块堆栈的主干中。图1给出了所提出的模型，我们称之为二阶视觉变换(So-ViT)。

以往的研究表明，矩阵功率归一化(MPN)[40]在二阶表示中起着核心作用。然而，由于我们的池化方法产生的表示法是一般的方阵(非对称或非正定义)或非方阵，现有的MPN及其快速算法无法应用。在MPN的启发下，我们提出了奇异值幂零化(svPN)方法。svPN可以通过奇异值分解(singular value decomposition, SVD)实现，但由于奇异值分解对GPU不友好，因此计算开销较大。因此，我们进一步发展了一个近似归一化变量，这是非常快速和有效的。

我们的贡献总结如下。
•我们提出了一种二阶视觉变换架构。我们引入了一个集成了可视标记和类标记的分类范式。同时，我们开发了一个小的，分层的模块，以有效嵌入可视标记。
•我们给出了奇异值幂的归一化，一般二阶表示。此外，我们还开发了一种适用于大规模深度学习的近似归一化方法。
•我们在ImageNet-1K上进行了广泛的实验
用来验证和评估我们的方法。我们是第一批证明了当从头开始训练时，视觉转换器可以在ImageNet-1K上实现引人注目的性能的人。

2. Related works

Transformer in vision field

变压器架构[39]的巨大成功吸引了计算机视觉领域越来越多的兴趣。这种独特的注意机制在视觉识别和后续视觉任务[11]中得到了应用。关于注意机制的众多著作大致可以分为两类：
在第一类中，不同的自我注意模块被明智地设计并插入CNN的骨干以提高性能[47,41,43]。这些模块可以捕获全局上下文知识，可以缓解CNN固有的局部接受域有限的缺点。
第二类研究网络骨干网本身是否可以纯粹基于注意机制[3,48]。
最近，视觉转换器(ViT)[8]在超大规模数据集上的训练已经赶上或超过了最先进的cnn。但是，如果在ImageNet-1K上从头开始训练ViT模型，则性能会显著下降。已经提出了几种方法来克服这一限制[38,44,12]。
DeiT[38]采用知识蒸馏策略对ViT模型进行培训，引入蒸馏token向教师模型学习知识。
T2T-ViT[44]提出了一个token到token的模块，用于嵌入可视token，而不是原始ViT中使用的幼稚token化。
在TNT[12]中，提出了一种变压器中变压器块，其中外部变压器块和内部变压器块分别学习块间和块内的依赖关系。
我们的工作与这些ViT变体平行，但不同的是，我们提出了一个分类范式，集成了视觉标记和类标记的二级池，以及一种有效的视觉标记嵌入方法。

Second-order pooling in CNN

二阶池化(又称双线性池化)通常产生对称正定(SPD)矩阵作为图像表示，是一个非常活跃的课题[46,42]。在一些视觉任务中，二阶池化被证明优于一阶全局平均池化[24,40]。规范化在改善二阶表征方面起着核心作用。
双线性CNN[26]由Fisher向量法[30]驱动，引入了元素级幂标准化和l2标准化。DeepO2P[17]利用了基于协方差矩阵黎曼几何的矩阵对数归一化，但这受到了数值稳定性的困扰。矩阵幂次归一化(Matrix power normalization, MPN)[22,25]计算协方差矩阵的幂次作为图像表示，其性能明显优于同类算法。特别是Li等人[40]揭示了MPN是稳健的协方差估计，同时有效利用了协方差矩阵的几何结构。由于MPN依赖于GPU不友好的特征分解，iSQRT[21]提出了一种快速迭代计算矩阵平方根的方法，适合于GPU并行实现。最近[31]的一项研究表明，二阶池的MPN改进了损耗函数的Lipschitzness，带来了快速的网络加速和对畸变图像的鲁棒性。本文研究了一般方阵和非方阵不能应用MPN的交叉协方差矩阵的归一化问题。

3. Second-order ViT architecture

我们首先概述So-ViT架构(第3.1节)。
然后，我们描述了可视化标记的交叉协方差池，
以及如何结合类到知进行分类(第3.2节)。
最后，我们介绍了可视化标记嵌入方法(第3.3节)。

3.1. Architecture overview

表1中给出了我们的二阶ViT (So-ViT)体系结构。在给定输入图像的基础上，设计了一个轻量级的分层结构模块，实现了视觉标记的嵌入。该模块是一个基于卷积的小型网络，由一个主干和一个级组成。从嵌入模块的卷积特征被重塑为一个向量序列作为视觉标记。
和[8]一样，我们在可视标记序列前添加一个可学习的类标记class token，然后添加位置嵌入以保留位置信息position embeddings。token sequence通过堆叠标准变压器块[8]送入主干。每个transformer block 由多头自注意(MSA)和多层感知器(MLP)组成。每个变压器块前后分别采用Layer normalization and shortcut connection。在每个SA中，将输入特征分别线性投影到称为查询、键和值的特征上，然后计算查询和键之间的相似度矩阵，最后通过将这些值与相似度矩阵相乘(在softmax之后)来计算值的线性组合。MLP包含两个完全连接(FC)层，在第一个FC之后有一个GELU非线性。通过主干，标记维数、头数和隐藏层维数(分别用p、h和p’表示)保持不变。
我们结合 visual tokens and class token进行分类。我们通过两个独立的线性投影将视觉标记映射到低维m和n的特征上。然后我们对特征的两个分支进行交叉协方差池，产生二阶表示。通过svPN对可视化标记进行归一化后，将其与类标记的表示相结合，提供给最终的softmax分类器。

3.2. Fusing class and visual tokens for classification 融合类和可视标记进行分类

变压器模型的传统分类范式完全依赖类标记，完全抛弃了视觉标记[8,39]。高级视觉符号包含丰富的图像语义知识，是类符号的补充。因此，我们提出了视觉tokens的二阶池，与类tokens集成用于分类。
设Z∈Rp×N是一个矩阵，其中每一列是一个视觉标记的p维特征。我们对特征矩阵Z分别进行两个线性投影，得到X = W1Z和Y = W2Z，其中W1∈Rm×p和W2∈Rn×p是可学习权矩阵。在不失一般性的前提下，我们假设X和Y都以零为中心，且m≥n。我们计算X和Y之间的交叉协方差矩阵，即XYT，然后奇异值幂零化作为二阶全局图像表示：
svPN（XY协方差矩阵）

注意XYT可以是一般的方阵(非对称或正定)或非方阵。正如[40]所指出的，规范化对全局二阶池起着重要作用。然而，矩阵功率归一化及其快速版本[40]只能用于SPD矩阵。我们提出了交叉协方差矩阵的奇异值幂归一化(svPN)。我们将svPN的动机和方法的细节推迟到下一节。
备注1。我们的二级表征XY T不同于自我注意(SA)机制。一个SA的输出形式可以是(XY T)W3Z，基本上是一阶表示，因为它是输入Z的线性组合，其中线性组合的系数由相似矩阵XT Y计算。这里W3是一个可学习权矩阵。
我们介绍了类tokens与视觉tokens相结合的几种融合方案，即聚合、求和、拼接，如图2所示。我们建议为可视化标记使用交叉协方差池。我们认为，一级全局平均池也可以使用[23,36,13]。
对于聚合方案，我们在最后一个变压器块(tranL)之后为所有令牌执行池，然后连续连接到FC和softmax分类器。
对于拼接方案，我们在tranL之后，将类标记和视觉标记的池化结果进行级联，并将级联后的表示提供给FC和softmax分类器。
对于求和方案，我们有两个独立的分支:一个分支是常用的类令牌，后面跟着FC，而另一个分支在汇集可视令牌之后，连接到一个单独的FC。两个fc的输出可以添加到一个softmax分类器中。或者，我们可以将每个FC连接到一个独立的softmax分类器，然后将这两个分类损失相加。

3.3. Embedding of visual tokens嵌入可视标记

原有的ViT缺乏翻译等方差和局域性的归纳偏差，而依靠超大的训练数据来克服这一限制[8]。一个自然的替代方案是将CNN和transformer结合起来的混合模型。在[8]中，ResNet-50第4阶段的卷积特征被反馈到变压器模型中，使得混合模型很重而获得很少。我们的理念是不同的:我们的想法是一个用于嵌入可视tokens的小层次模块，而主干仍然依赖于transformers块。
我们提出了一个轻量级的分层模块来实现视觉标记的嵌入，而不是在[8]中通过固定大小的补丁的线性投影来实现的简单方法。我们的模块非常简单，由一个干stem和一个阶段stage组成。
该stem由3×3卷积(conv)与64个滤波器，随后的最大池化stride 2 (S2)。
后续stage阶段包含3个剩余瓶颈[13]的堆栈。每个瓶颈的中间3×3 conv的下采样步长为2。
为了兼容后续变压器块的尺寸，我们利用了一个带有p通道的1×1 conv过渡层。在每个卷积层之后依次是BN层和ReLU层。对于H × W像素的输入图像，我们的标记嵌入的输出是空间大小为H/8 × W/8的特征映射，有p个通道，其中p是变压器块的维数。通过将空间维度展平，我们得到了一个N = HW/64个p维视觉标记序列。
我们模块中的阶段是基于ResNet块的。无论如何，我们的选择是非常灵活的:我们也可以堆叠Inception块[37]，DenseNet块[16]，或者非本地块[41]。我们的实验(5.1节)表明，这些不同的选择表现良好，都优于T2T[44]的视觉标记嵌入竞争方法。这表明我们基于卷积的嵌入思想很重要，而不是特定的卷积块。

4. Normalization of cross-covariance matrix交叉协方差矩阵的标准化

我们首先描述交叉协方差矩阵的奇异值幂归一化svPN(第4.1节)。接下来，我们介绍一种高效快速的近似svPN(4.2节)。

4.1. Singular value power normalization奇异值功率归一化

我们的方法是基于MPN[40]，这是一种对协方差矩阵XXT进行归一化的有效方法。它由协方差矩阵的特征向量对应的特征值的计算能力构成。主成分分析的最大方差公式[2，第12章]指出，将随机样本连续投影到主成分的不相关方向上，可以依次得到从方差最大到方差最小的结果。由于主成分/方差对应于协方差矩阵的特征向量/特征值，所以MPN可以统计上解释为根据主成分特征方向缩小方差。进一步，我们提出了交叉协方差矩阵XYT的奇异值归一化。
我们把X和Y分别看作随机向量X∈Rm和Y∈Rn的N个样本组成的两个矩阵。设u∈Rm, v∈Rn为两个单位向量，即:∥u∥=∥v∥= 1。我们知道R(Q,u,v) = uTXYTv是x在u上的投影和y在v上的投影的协方差，其中Q = XYT。对目标maxu,v，∥u∥=∥v∥=1 R(Q, u,v) = uT XY T v的解u1和v1是对应于最大值λ1 = R(Q, u1, v1)的左、右奇异向量。给定uk和vk, k≥1，在uTui =0andvTvi =0fori

4.2. Approximate, fast singular value power nor- malization近似，快速奇异值幂化

基于机器学习[10]中广泛使用的低秩假设，我们只需估计几个最大奇异值就可以有效地实现近似归一化。我们利用[34]中引入的迭代法，按降序连续估计奇异值。给定初始向量v(0)，迭代过程采用如下形式:

其中上标表示迭代次数。经过多次迭代，我们得到了近似的最大奇异值σˆ1 =∥QT u(j+1)∥和相应的左、右奇异向量uˆ1 = u(j+1)， vˆ1 = v(j+1)，其中ˆ表示它们是近似的值。假设我们有第k个最大奇异值，我们压缩矩阵Q得到

合理的做法是，我们将第1个奇异值缩小到(r−1)个奇异值，与相应的奇异向量对齐，同时使用第r个最大奇异值来缩小剩下的奇异值。

5. Experiments

我们首先评估了提议的So-ViT架构(第5.1节)，
然后进行了奇异值功率归一化的奇异值研究(第5.2节)。
然后我们与T2T-ViT[44]进行比较，这与我们的方法密切相关(5.3节)。
最后，我们比较了目前最先进的ViT变体和CNN模型(5.4节)。

我们的实验是在ImageNet-1K基准[6]上进行的，该基准[6]包含128万张训练图像和5万张验证图像。
我们的实现：
基于PyTorch框架，
模型使用8个NVIDIA 2080Ti gpu进行训练。
我们从零开始训练So-ViT模特。
我们采用标准尺度、颜色和翻转抖动进行数据增强[18,13]。
在[44]之后，我们还采用了一些常用的数据增强技术，包括mixup[14]、randAugment[5]、cutmix[45]，以及值为0.1[36]的标签平滑。
我们使用AdamW[28]算法进行网络优化，
batch为512，
权值衰减为0.05。
迭代从初始学习速率1e-6开始，增加到5e-4(重复，1e-3)，在14和19模型的三个预热期(重复，7和10)变压器块。
我们使用最终学习率为1e- 5[27]的余弦退火算法。
我们使用310个训练epoch，因为变压器模型需要更多的迭代[8,44,12]。为了便于5.1和5.2节中广泛的烧蚀分析，我们使用了包含7个transformer blocks(即So- vita -7)的浅网，图像分辨率为112×112。为了与最先进的模型进行比较，在5.3和5.4节中，我们采用了传统的图像分辨率224×224。
我们设计了一系列具有不同数量的变压器块L的模型，即So-ViT-7/10/14/19，其中p =256/256/384/448, h = 4/4/6/7，其中对于前两个模型p ’ = 2p，对于后两个模型p ’ = 3p。

5.1. Evaluation of the So-ViT architecture

本节评估所提出的视觉token嵌入方法、将视觉token与类token集成起来的分类范式。

可视化标记嵌入模块
我们的嵌入模块如表1底部所示，由一个3 × 3 conv的stem和一个由3个残块组成的stage组成。stage的设计也可以基于Inception, DenseNet或Non-local块。由于篇幅有限，有关嵌入变体的细节见附录。

表2比较了不同嵌入模块和T2T模块[44]。我们提到T2T模块是一个强基线，其中软分裂操作被引入到变压器块堆栈之前的变压器块中，以学习visual标记的局部结构。值得注意的是，所有基于卷积的嵌入模块的性能比T2T模块高出约2% ~ 3%。结果表明，基于卷积的嵌入方法是非常有效的。这也暗示了自动设计更高级的嵌入方法的潜力(例如，通过神经结构搜索[9])。

分类头的融合方案

不同融合方法的比较见表3。我们首先注意到，所有使用二阶池的融合方案都比基线的性能好约2 ~ 4%，参数略有增加，但不影响TFLOPs;
sum (FC, 2)方案效果最好，准确率比基线高4.5%。
对于一阶池融合方案，concat和sum (FC)方案优于基线方案，其他两种方案均低于基线方案。由于基线表示的维数(256-D)小于融合方法的维数，为了便于比较，我们在基线上增加了一个额外的线性投影，将类标记的维数增加到2048，称为基线+。
我们注意到基线+比基线略有改善，但仍明显落后于最佳融合方法(70.97 vs. 74.93)。
这表明，所提方法的性能提高主要是由于我们的分类范式(即融合方案)，而不是简单地增加维度。
从上面的分析，我们有两个观察：
(1)视觉标记与类标记相结合的分类效果明显优于单类标记，表明了所提出的分类范式的有效性。(2)与一阶池相比，二阶池获得了较大的收益，说明所提出的交叉协方差池对视觉标记是非常有效的表示。

5.2. Evaluation of svPN for second-order pooling

在本节中，我们将评估精确的标准化(即svPN)和近似的标准化(即s^vPN)。
然后，我们比较相似矩阵和交叉协方差矩阵。
然后，我们评估交叉协方差矩阵大小对绩效的影响。
最后我们比较了不同的归一化方法。
精确归一化和近似归一化
我们的归一化svPN可以通过计算所有奇异值/向量的奇异值分解(SVD)精确实现。近似方法s^vPN
使用简单的迭代算法来逼近少数奇异值/向量。
对于svPN，表4a上半部分显示了指数α (Eq. 2)的效果，其中α = 0.5的精度最高。然而，通过SVD的svPN在计算上非常昂贵，仅以110赫兹运行。在表4a的下部分，设置α = 0.5，我们评估奇异值的数量(#sv)和迭代次数(#iter)对s^vPN (Eq. 6)
的影响。我们注意到总体上近似归一化略低于精确归一化。当只使用最大奇异值时，迭代次数的增加带来的收益并不显著。值得一提的是，在光谱归一化[29]中也观察到类似的现象，在权值归一化中只使用一次迭代来估计最大的奇异值。当我们使用两个或三个最大的奇异值时，我们观察到性能下降。我们认为原因是，后续奇异值/向量的估计受到了前一个不准确的严重影响。本文采用单最大特征值的s^vPN对二阶池进行一次迭代归一化。
交叉协方差矩阵与相似矩阵
如第3.2节所述，我们使用视觉标记的交叉协方差矩阵XY T作为最终的图像表示。另外，也可以使用相似矩阵xty。这里我们比较表4b中的两种不同表示。可以看出，相似度矩阵的正确率比交叉协方差矩阵低约4.9%。需要注意的是，相似度矩阵是空间位置相关的，这意味着平移图像中的物体会导致不同的表示方式，不利于分类。相反，交叉协方差矩阵是一个稳健的，位置不变的表示，即，任何视觉标记的排列产生相同的交叉协方差矩阵。

交叉协方差矩阵的维数
协方差矩阵的维数为m × n，其中m和n为两个线性投影的维数，如3.2节所述。表4c显示了交叉协方差矩阵的维数(Dim)对性能的影响。我们可以看到，当尺寸变大时，精度不断增加。当Dim=8K时，准确率比只使用class token的基线(70.4%，表3)高7.6%。当Dim为512时，准确率仍然比基线高2.8%。请注意，较高的Dim会导致更大的参数数，但计算量的增加非常小。为了性能参数的折衷，我们选择Dim=2K，除非另有指定。

比较不同的归一化方法
我们将其与基于元素的功率归一化(EPN)进行比较，我们调整了功率的值，得到的值为1/2作为最佳超参数。我们还比较了层归一化(LN)和一种简单的缩放方法，即除以√N，其中N是可视标记的数量。我们没有与MPN(或其更快的视觉iSQRT-COV)进行比较，因为交叉协方差池产生的一般方阵或非方阵是MPN不能应用的。对比结果见表4d。我们可以看到，所有的规范化方法都比没有规范化的基线有所改善，这说明了规范化对于二级池的重要性。在所有归一化方法中，我们的svPN表现最好，top-1的精度比次优方法高0.5%，比基线提高约1.1%。

5.3. Comparison with T2T-ViT

与我们的方法类似，T2T-ViT提出了一个T2T模块来更好地嵌入令牌，而不是原始ViT中的朴素嵌入方法。因此，本节将与这个ViT变体进行比较，结果如表5所示。

由于ResNet-50/101与so -vit-14/19的计算具有可比性，我们也列出了他们的结果以供参考。我们首先注意到So-ViT和T2T-ViT模型都明显优于ResNet模型。这说明变压器模型具有较强的表示学习能力。此外，当使用相同数量的变压器块时，我们的So-ViT始终优于T2T-ViT 1% ~ 5%。
接下来，我们比较它们的收敛性和速度。总的来说，我们的模型比T2T-ViT的收敛速度快，因为我们的So-ViT的性能可以与训练了310个epochs的T2T-ViT相媲美。例如，T2T- ViT-14在310epochs的情况下达到80.7%的精度，而我们的模型只需要188epochs就可以获得相同的精度。特别是对于较浅的模型，So-ViT收敛速度更快，例如，具有89个时点的So-ViT-7可以达到具有310个时点的T2T-ViT-7的性能。对于7/10变压器块的较浅型号，我们的So-ViT具有与T2T-ViT相当的速度，T2T-ViT使用一个高效的变压器块[49]。对于深度为14/17的车型，我们的So-ViT比T2T-ViT快1.3倍。

5.4. Comparison with state of the art

最后，我们比较了依赖于ViT或CNN的最先进的模型。对于ViT变体，我们比较T2T-ViT [44]， DeiT[38]和TNT[12]。在表6的上半部分，我们比较了针对移动应用程序的精简模式。

可以看出So-ViT-7的准确率比T2T-ViT- 10高2.1%，So-ViT-10与T2T-ViT- 12的准确率差距约为2.4%。表6的中间部分比较了与ResNet- 50具有可比性计算的模型。可以看出，我们的so-vit-14比DeiT-S、t2t -vit-14t和TNT-S分别高出约2.0%、1.1%和0.5%。通过结合SE块[15]，TNT-S的精度有所提高，但仍低于我们的精度。
如表6底部所示，我们的so-vit-19比t2t -vit-19的表现好1.0%;TNT-B的精度比我们的高，但它的参数和TFLOPs要大得多。
最后，我们注意到，无论是针对移动环境的精简网络，还是针对高性能的复杂、更深层次的模型，所提出的So-ViT模型的性能都与最先进的CNN模型不相上下或更好。

6. Conclusion

提出了一种用于图像分类的二阶视觉变换(So-ViT)模型。对于网络头，我们提出将视觉tokens的交叉协方差池与类令牌集成到分类器。据我们所知，这是首次尝试利用转换器体系结构中的高级可视特性进行最终分类。对于网络输入，我们设计了一个基于现有卷积的有效视觉标记嵌入的小层次模块。大量实验表明，与目前最先进的ViT模型和CNN模型相比，我们的So-ViT模型具有很强的竞争力。我们的视觉标记嵌入思想的有效性表明，通过NAS[9]自动寻找嵌入模块是很有前途的。未来，我们有兴趣研究我们的So-ViT将如何执行NLP[39]的任务。

云原生安全工具：数字基础设施的免疫长城花海如潮淹云原生安全经验分享笔记
⚡运维团队的三重核灾难1.容器漏洞的连锁爆炸某金融平台因基础镜像包含未修复的Log4j漏洞，黑客横向穿透182个Pod，导致2.3亿用户数据泄露（CNCF2024安全报告）。更致命的是，53%的漏洞存在于第三方镜像（Sysdig研究），传统扫描器漏检率超35%。2.微服务边界的信任崩塌某电商因未限制服务账户权限，攻击者通过促销API入侵支付系统，45分钟盗取$4300万（FBI加密犯罪档案）。Ku
《天道》中的绝世之恋回南少年
image.png天道是一部很深刻的电视剧，改编自小说《遥远的救世主》，一场超越生死的旷世爱情，一个设计精巧的商业传奇，一场针对人性的深入探索。丁元英是个明白人，是一个孤独的智者。在投资领域经历过大风大浪之后，不执着于出人头地，想要平淡安静的生活。丁对自己有着清晰的认识，有着明确的价值观念和行为准则，不在意别人对自己的看法，不需要通过外界的认可来体现自己的价值，这就决定了他对传统文化的成见。丁元英
向量数据库FAISS/Chromadb/ES/milvus简单概述
FAISSFAISS（FacebookAISimilaritySearch）是一种高性能的向量相似性搜索库，用于在大规模向量数据集中快速搜索最相似的向量。它是由FacebookAIResearch开发的，旨在解决大规模向量搜索的问题，广泛应用于各种领域，如图像搜索、文本搜索、推荐系统等。FAISS的主要特点和优势如下：高效的相似性搜索：FAISS使用了一系列高效的算法和数据结构，如倒排索引、局部敏
大语言模型：人像摄影的“达芬奇转世”？——从算法解析到光影重塑的智能摄影革命黑巧克力可减脂 AIGC 语言模型人工智能自然语言处理
导言在摄影术诞生之初，达芬奇或许无法想象，他对于光影、比例和解剖的严谨研究，会在数百年后以另一种形式重生。今天，当摄影师面对复杂的光线环境或苦苦寻找最佳构图时，一位由代码构筑的“光影军师”正悄然降临——大语言模型（LLM）正以前所未有的方式，重塑人像摄影的创作边界。解构经典：大语言模型如何“消化”百年摄影智慧大语言模型并非凭空创造建议，其根基在于对海量摄影知识体系的深度理解与结构化重组。理论内化：
算法工程师必备：数据结构10大经典算法详解数据结构与算法学习数据结构与算法宝典算法数据结构 ai
算法工程师必备：数据结构10大经典算法详解关键词：数据结构、经典算法、时间复杂度、应用场景、代码实现摘要：本文是算法工程师的“算法工具箱”指南，系统讲解数据结构领域最核心的10大经典算法（快速排序、归并排序、二分查找、深度优先搜索DFS、广度优先搜索BFS、动态规划、贪心算法、KMP字符串匹配、哈希算法、并查集）。通过生活案例、代码示例、复杂度分析和实战场景，帮你彻底掌握这些算法的原理与应用，真正
星座占星三王星深层次意义亮天机
image每一个地球人的命盘上都有天王、海王与冥王。这三颗星代表了人类最极端的三种潜在趋势，即——神性、魔性与变异。由于他们的存在，所以任何一个人都有产生任何一种变化的可能性。所以再善良的人都堕落的空隙、再邪恶的人都有成佛的可能，再顺从的人被压迫久了都会叛变。image天王——蛰伏在人类基因中的不确定因子。我们生活的领域里充满各式各样的惯性。物体有惯性，总试图维持当前的运动状态；人有惯性，总拒绝任
深入解析部分可观测马尔可夫决策过程（POMDP）及其应用码字的字节算法人工智能马尔可夫决策过程 POMDP
POMDP的基本概念与模型部分可观测马尔可夫决策过程（PartiallyObservableMarkovDecisionProcess,POMDP）是强化学习领域中处理不完全信息环境的核心数学模型。与完全可观测的马尔科夫决策过程（MDP）相比，POMDP更贴近现实世界中智能体面临的感知局限，其核心特征在于系统状态无法被直接观测，智能体必须通过间接的观测信号来推断潜在状态。POMDP的七元组模型PO
2023年第10期(NeuroImage)：DomainATM：多中心医学图像数据标准化工具箱影浮科技ImageFlow
基本信息1.标题：DomainATM:Domainadaptationtoolboxformedicaldataanalysis.2.期刊：NeuroImage3.IF/JCR/分区：7.4/Q1/中科院一区4.DOI：10.1016/j.neuroimage.2023.119863目录1、导读2、背景动机3、研究目的4、工具箱介绍5、测试试验6、局限不足1导读域适应（DA）是基于机器学习的现代医
WPF PRISM 绑定事件及拖拽研究 zhs1931 C#WPF
publicRelayCommandWindowSizeChangedCommand{get{if(WindowSizeChangedCommand==null)WindowSizeChangedCommand=newRelayCommand(param=>WidowSizeChanged(param));returnWindowSizeChangedCommand;}}publicvoidWin
C# 实现：动态规划解决 0/1 背包问题江沉晚呤时 C#算法代理模式 .netcore c#microsoft .net .net core 算法
在生活中，我们经常面临选择和优化的问题。例如：在有限的资源（如时间、金钱、空间等）下，如何选择最有价值的物品？背包问题（KnapsackProblem）就是一种经典的优化问题，广泛应用于项目选择、投资决策、行李打包等领域。今天，我们将深入探讨0/1背包问题，并通过动态规划方法给出一种高效的解决方案。0/1背包问题0/1背包问题的基本描述是：给定一个容量为C的背包。有n个物品，每个物品有一个重量w[
No module named "Crypto"，如何安装Python三方模块Crypto weixin_30342827 python 操作系统
前两天公司公司老总让我研究怎么用企业微信第三方应用进行官网对接，完成URL回调验证问题。具体如何进行Python的Django网站与企业微信第三方应用进行回调验证的博客地址为：https://www.cnblogs.com/ws17345067708/p/10522472.html这里讲讲，如何在win10下，安装一个非常坑爹的加密算法库，名字叫"Crypto"看了好多博客，没有一个管用的，要么就
居心叵测!商小信第六届研究所姜新宁算力3.0不能提现提款!!被骗真实原因令人匪夷所思! 大盛律道
随着这几年经济的发展，股市也经历了一定的成长，股民越来越多。由于人性的贪婪，市场监管的缺陷，互联网平台监管不力，众多网络骗子便把目光顶到了股民，尤其是处于亏损状态，迫切渴望摆脱被套牢的命运。近期8月，有骗子冒充姜新宁，打着“算力3.0市场”“低成本高收益”“国家扶持项目”等幌子的非法金融活动时有发生，很多人在不懂投资、不追问平台是否合法、一心只想赚钱的心态下，被不法分子姜新宁（骗子假冒的）所利用，
大数据领域 Kafka 入门指南：从安装到基础使用大数据洞察大数据与AI人工智能大数据 kafka linq ai
大数据领域Kafka入门指南：从安装到基础使用关键词：Kafka、消息队列、分布式系统、大数据处理、实时数据流、生产者消费者模型、ZooKeeper摘要：本文是一篇全面介绍ApacheKafka的入门指南，从基本概念到实际应用。我们将详细讲解Kafka的核心架构、工作原理，并提供从安装配置到基础使用的完整实践指导。文章包含Kafka的生产者-消费者模型实现、集群部署策略、性能优化技巧，以及在大数据
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
2019-07-27文献阅读记录一行白鹭上青天
题目：城市群视角下空间联系与城市扩张的关联分析期刊：地理科学进展ProgressinGeography作者：焦利民，唐欣,刘小平摘要：在城市群发展的不同阶段，城市扩张表现出不同的时空特征。从城市群视角研究城市扩张的时空规律，对于理解城市扩张与城市群网络化组织结构之间的复杂耦合关系具有重要意义。本文以长江三角洲城市群为例，基于交通网络、引力模型和空间句法模型，结合1980、1990、2000和201
牛客华为机试题解（python版更新中）
目录一、字符串（知识点）HJ1字符串最后一个单词的长度（简单）HJ2计算某字符出现次数（简单）HJ4字符串分隔（简单）HJ5进制转换（简单）HJ10字符个数统计（简单）HJ11数字颠倒（简单）HJ12字符串反转（简单）HJ14字符串排序（简单）HJ17坐标移动（中等）HJ18识别有效的IP地址和掩码并进行分类统计（较难）自己研究的题解，也有借鉴评论区牛人思路，答案不唯一，仅供学习参考，也欢迎大家指
省妞平台返利靠谱吗？省妞app邀请码怎么填？省妞官方邀请码是多少？如简导师
在如今这个电商蓬勃发展的时代，省妞这个平台逐渐走进了人们的视野。一、省妞的基本概念省妞是一个融合了社交元素的电商优惠平台。它致力于在消费领域为用户开辟出一条既能省钱又能赚钱的独特道路。二、省钱方面的亮点汇聚海量优惠券省妞就像是一个巨大的优惠券宝库，这里集中了众多电商平台的优惠券。无论是淘宝、京东还是拼多多等主流平台，都能在省妞上找到对应的优惠资源。从日常的生活用品到奢侈的时尚单品，各种品类的优惠券
Self-Consistency：跨学科一致性的理论与AI推理的可靠性基石大千AI助手人工智能 Python #Prompt 人工智能机器学习神经网络算法大模型幻觉 LLM
本文综合其在逻辑学、心理学及人工智能领域的核心定义、技术实现与前沿进展来对Self-Consistency（自洽性）进行系统性解析。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与跨学科内涵基础概念逻辑学定义：指理论或系统内部逻辑自洽，无矛盾或悖论。例如物理理论中，狭义相对论的速度变换
*SFT深度实践指南：从数据构建到模型部署的全流程解析大千AI助手人工智能 Python #OTHER 人工智能深度学习算法大模型 SFT 微调 Lora
一、SFT技术原理与定位核心定义SFT是在预训练语言模型（如LLaMA、GPT）基础上，利用标注数据优化模型以适应特定任务的技术。其本质是通过调整模型参数，将通用语言能力迁移至专业领域（如法律、医疗）或任务（如对话生成、代码补全）。与预训练的区别预训练：使用无标注数据（如维基百科）学习通用表征，消耗千亿级token算力。SFT：使用标注数据（如指令-答案对）进行任务适配，成本仅为预训练的1/100
迁移学习：知识复用的智能迁移引擎 | 从理论到实践的跨域赋能范式大千AI助手人工智能 Python #OTHER 迁移学习人工智能机器学习算法神经网络大模型迁移
让AI像人类一样“举一反三”的通用学习框架本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与基本概念迁移学习（TransferLearning）是一种机器学习范式，其核心思想是：将源领域（SourceDomain）学到的知识迁移到目标领域（TargetDomain），以提升目标任务的性能
《重生后，我打脸渣男狗女》&唐秋林澈苏渺渺小说完整版在线阅读~<重生后，我打脸渣男狗女>一看到底！今日推文2
《重生后，我打脸渣男狗女》&唐秋林澈苏渺渺小说完整版在线阅读~一看到底！《重生后，我打脸渣男狗女》&唐秋林澈苏渺渺小说完整版在线阅读~一看到底！《重生后，我打脸渣男狗女》&唐秋林澈苏渺渺小说完整版在线阅读~一看到底！※※※※※※※※※※※※※※※※※※※※※※※※※阅读建议：下拉文章最底部看全文————※※※※※※※※※※※※※※※※※※※※※※※※※苏渺渺发文：“呕心沥血了三年才研究出的科研项目
LiteCoT：难度感知的推理链压缩与高效蒸馏框架大千AI助手人工智能 #Prompt #OTHER 深度学习人工智能机器学习自然语言处理提示词 LiteCoT 思维链
“以智能裁剪对抗冗余，让推理效率与精度兼得”LiteCoT是由香港科技大学（广州）联合独立研究者团队提出的创新方法，旨在解决大模型知识蒸馏中推理链过度冗长和缺乏难度适应性的核心问题。该方法通过难度感知提示（DAP）动态生成精简的推理链，显著提升小模型推理效率与准确性。相关论文发表于arXiv预印本平台（2025年），为当前大模型轻量化部署的前沿方案。本文由「大千AI助手」原创发布，专注用真话讲AI
复刻劳力士日志哪个厂的好(这10个厂家一定要知晓) 潮品会
劳力士日志作为劳力士品牌旗下的经典之作，一直以来都备受表迷喜爱。然而，高昂的价格让许多喜爱它的人望而却步。幸运的是，市场上出现了许多复刻劳力士日志的厂家，它们以优质的产品和服务，让更多人有机会拥有这款经典之作【重要提醒】文章最下面有联系方式将为您介绍十家顶级复刻劳力士日志厂家，让您感受它们为您带来的美好时光。1.C厂C厂作为劳力士复刻表领域的佼佼者，以其卓越的工艺和完美的细节闻名于世。其产品几乎覆
数字图像处理与Python语言实现-Box模糊CUDA实现视觉与物联智能数字图像处理与Python实现 python 深度学习计算机视觉图像处理 CUDA
Box模糊CUDA实现文章目录Box模糊CUDA实现1、Box模糊的基本原理2、算法优化：滑动窗口技术3、参数对模糊效果的影响4、Box模糊的优缺点5、与高斯模糊的对比6、实际应用场景7、算法实现7.1PyCUDA实现7.2CuPy实现7.3C++与CUDA实现8、总结在图像处理领域，**Box模糊（方框模糊或均值模糊）**是一种基础且高效的模糊算法，其核心思想是通过对像素邻域内的颜色值取平均值来
【爬虫】某某查cookie逆向 kisloy 逆向爬虫爬虫 python
代码仅供技术人员进行学习和研究使用，请勿将其用于非法用途或以任何方式窃取第三方数据。使用该代码产生的所有风险均由用户自行承担，作者不对用户因使用该代码而造成的任何损失或损害承担任何责任。加密参数加密参数主要是cookie，其中只有三个cookie最重要，BAIDUIDBAIDUID_BFESS和一个ab开头的cookiecookie获取BAIDUID和BAIDUID_BFESS在访问百度系的产品时
python如何抓取网页里面的文字_如何利用python抓取网页文字、图片内容？ weixin_39917437
想必新老python学习者，对爬虫这一概念并不陌生，在如今大数据时代，很多场景都需要利用爬虫去爬取数据，而这刚好时python领域，如何实现？怎么做？一起来看下吧~获取图片：1、当我们浏览这个网站时，会发现，每一个页面的URL都是以网站的域名+page+页数组成，这样我们就可以逐一的访问该网站的网页了。2、当我们看图片列表时中，把鼠标放到图片，右击检查，我们发现，图片的内容由ul包裹的li组成，箭
ConcurrentHashMap深度解析编程界的彭于晏qaq java java
ConcurrentHashMap深度解析引言：并发容器的"扛鼎之作"在Java并发编程领域，ConcurrentHashMap无疑是最核心的容器之一。作为HashMap的线程安全替代品，它既解决了Hashtable全表锁导致的性能瓶颈，又规避了HashMap在并发环境下的数据不一致风险（如死循环、数据丢失）。自JDK1.5引入以来，ConcurrentHashMap经历了三次重大演进（JDK7分
如何用 Python 绕过 cloudflare（5秒盾）抓取数据：也不是很难嘛！炒青椒不放辣 Web爬虫进阶实战 python cloudflare 爬虫 5秒盾逆向
大家好！我是爱摸鱼的小鸿，关注我，收看每期的编程干货。逆向是爬虫工程师进阶必备技能，当我们遇到一个问题时可能会有多种解决途径，而如何做出最高效的抉择又需要经验的积累。本期文章将以实战的方式，带你全面了解cloudflare（5秒盾）以及如何绕过使用cloudflare服务的网站从而抓取数据特别声明：本篇文章仅供学习与研究使用，不用做任何非法用途，相关URL和API等均已做脱敏处理，若有侵权请联系作
聊天主播适合哪个平台，谈谈我的经验糖葫芦不甜
选择合适的平台对于聊天主播而言至关重要，它不仅关乎内容的传播效果，还直接影响到粉丝积累与收入增长。5星公会，免费加入，一对一指导扶持↓微信在文章底部。抖音和快手作为短视频领域的巨头，近年来在直播领域也持续发力。这两个平台拥有庞大的用户基数和高度活跃的社区氛围，为聊天主播提供了广阔的舞台。虽然斗鱼和虎牙以游戏直播起家，但它们在泛娱乐直播领域也占据了重要地位。这两个平台在游戏玩家中具有极高的知名度，同
上班族什么副业赚钱?分享15个适合上班族的副业路子! 氧惠好物
每个月的薪水是否经常令你感到焦虑?是否曾考虑过通过副业来增加收入?如今，越来越多的上班族发现，工资难以满足他们的生活需求，因此他们开始探索副业来增加收入。那么，上班族如何找到适合自己的副业呢?下面将分享15个适合上班族的副业赚钱途径，或许能为你带来一些启发。1.自媒体自媒体涵盖了文章写作和视频制作，如果你有创意和内容，可以选择这个领域。通过将你的作品发布在头条号、百家号、企鹅号、大鱼号、网易号等平
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

文献阅读（十七）：So-ViT: Mind Visual Tokens for Vision Transformer