Phoenixtree_DongZhao

卷积网络重新反超 Transformer，ConvNeXt：A ConvNet for the 2020s

A ConvNet for the 2020s

Paper: https://arxiv.org/pdf/2201.03545.pdf

Code: https://github.com/facebookresearch/ConvNeXt

本文的主要思想是，将 Swin-Transformer 中使用的方方面面的技术使用在传统 ConvNet 上，来探讨这些技术是否能够在 ConvNet 上 work。结果发现是肯定的。

Abstract

1. 背景介绍

2. ConvNeXt 设计思路

2.1 Training Techniques 训练技术

2.2. Macro Design: 宏观设计

2.3. ResNeXt-ify：ResNeXt 化设计

2.4. Inverted Bottleneck：逆瓶颈

2.5. Large Kernel Sizes：大卷积核

2.6. Micro Design：微观设计

Abstract

The “Roaring 20s” of visual recognition began with the introduction of Vision Transformers (ViTs), which quickly superseded ConvNets as the state-of-the-art image classification model. A vanilla ViT, on the other hand, faces difficulties when applied to general computer vision tasks such as object detection and semantic segmentation. It is the hierarchical Transformers (e.g., Swin Transformers) that reintroduced several ConvNet priors, making Transformers practically viable as a generic vision backbone and demonstrating remarkable performance on a wide variety of vision tasks. However, the effectiveness of such hybrid approaches is still largely credited to the intrinsic superiority of Transformers, rather than the inherent inductive biases of convolutions. In this work, we reexamine the design spaces and test the limits of what a pure ConvNet can achieve. We gradually “modernize” a standard ResNet toward the design of a vision Transformer, and discover several key components that contribute to the performance difference along the way. The outcome of this exploration is a family of pure ConvNet models dubbed ConvNeXt. Constructed entirely from standard ConvNet modules, ConvNeXts compete favorably with Transformers in terms of accuracy and scalability, achieving 87.8% ImageNet top-1 accuracy and outperforming Swin Transformers on COCO detection and ADE20K segmentation, while maintaining the simplicity and efficiency of standard ConvNets.

背景：视觉识别的 “咆哮的20年代” 始于 Vision Transformer (ViTs) 的引入，它很快取代了卷积神经网络(ConvNets)，成为最先进的图像分类模型。另一方面，普通的 ViT 在应用于一般的计算机视觉任务 (如对象检测和语义分割) 时面临困难。正是分层的 Transformer (例如 Swin Transformer ) 重新引入了几个 ConvNet 先验，使得 Transformer 实际上可以作为通用的视觉主干，并在各种各样的视觉任务中表现出显著的性能。然而，这种混合方法的有效性在很大程度上仍然归功于 Transformer 的内在优势，而不是卷积的固有归纳偏差。

方法：本文重新审视了设计空间，并测试了纯粹的 “卷积神经网络” 所能达到的极限。本文逐渐将标准ResNet “现代化”，以实现 Transformer 的设计，并发现了几个关键的组件，这些组件有助于实现性能差异。这一探索的结果是一系列被称为 ConvNeXt 的纯 ConvNet 模型。

性能：完全由标准 ConvNet 模块构建，ConvNeXts 在准确性和可扩展性方面优于 Transformer ，实现了 87.8% 的 ImageNet 准确度，在 COCO 检测和 ADE20K 分割方面优于 Swin transformer，同时保持了标准 ConvNet 的简单性和效率。

1. 背景介绍

本文的 Introduction 非常清晰的描述了这几年，CNN 和 Transformer 的发展过程和相互关系，并描述了作者的心路历程。

Introduction

回顾 21 世纪 10 年代，深度学习取得了巨大的进步，产生了巨大的影响。主要的驱动力是神经网络的复兴，特别是卷积神经网络 (ConvNets)。十年来，视觉识别领域成功地从工程特征转变为设计 (ConvNet) 架构。尽管反向传播训练卷积神经网络的发明可以追溯到 20 世纪 80 年代的 [ Yann LeCun, et al. Backpropagation applied to handwritten zip code recognition. Neural computation, 1989 ]，但直到 2012 年底，才看到它的真正的视觉功能学习潜力。AlexNet 的推出促成了 “ImageNet时刻” 的诞生，开启了计算机视觉的新时代。自那以后，这一领域的发展速度很快。典型的卷积神经网络如 VGGNet [61]，Inception [64]、ResNe(X)t [26,82]、DenseNet [33]、MobileNet [32]、EfficientNet [67] 和 RegNet [51]，这些工作分别关注准确性、效率和可伸缩性的不同方面，并推广了许多有用的设计原则。

ConvNets 在计算机视觉中的完全主导地位并非巧合：在许多应用场景中，滑动窗口策略是视觉处理的固有特性，特别是在处理高分辨率图像时。卷积神经网络有几个内置的归纳偏差，使其非常适合各种计算机视觉应用。最重要的一个是 translation equivariance，这对于一些视觉任务来说是一个理想的性质，如目标检测。卷积神经网络本身也是高效的，因为当以滑动窗口的方式使用时，计算是共享的。几十年来，这一直是卷积神经网络的默认使用，通常用于有限的对象类别，如数字、人脸和行人。进入 2010 年代，基于区域的探测器（region-based detectors，如 Fast R-CNN，Mask R-CNN）进一步证明了卷积神经网络已经成为视觉识别系统的基本组成部分。

大约在同一时间，为自然语言处理 (NLP) 设计神经网络的漫长历程走上了一条截然不同的道路，Transformer 取代了循环神经网络，成为了主导的 backbone。尽管语言和视觉领域在兴趣任务上存在差异，但随着 vision transformer (ViT) 的引入，这两种潮流在 2020 年出人意料地融合在一起，完全改变了网络架构设计的格局。除了最初的 “patchify” 层，它将图像分割成一系列的 patch, ViT 没有引入图像特异性的感应偏差，并且对原始的 NLP transformer 进行了最小的改变。ViT 的一个主要关注点是 scaling 行为：在更大模型和数据集尺寸的帮助下，transformer 可以显著超过标准ResNets。这些图像分类任务的结果是鼓舞人心的，但计算机视觉并不局限于图像分类。正如前面所讨论的，在过去的十年中，许多计算机视觉任务的解决方案很大程度上依赖于滑动窗口、全卷积范式。由于没有 ConvNet 的归纳性偏见，普通的 ViT 模型在被采用为通用视觉主干时面临许多挑战。最大的挑战是 ViT 的全局注意力设计，它与输入大小相比具有二次复杂度。这对于 ImageNet 分类可能是可以接受的，但是对于高分辨率的输入很快就变得难以处理。

Hierarchical Transformers 采用了一种混合方法来弥补这一差距。例如，滑动窗口策略 (例如在局部窗口内的注意力) 被重新引入到 transformer 中，使得它们的行为更类似于 ConvNets。Swin Transformer[42] 是这一方向上的里程碑式工作，首次证明 Transformer 可以作为通用的视觉 backbone，并在图像分类之外的一系列计算机视觉任务中实现最先进的性能。Swin Transformer的成功和迅速采用也揭示了一件事：卷积的本质并没有变得无关紧要; 相反，它仍然很受欢迎，从未退出历史。

从这个角度来看，Transformer 在计算机视觉方面的许多进步都旨在恢复卷积。然而，这些尝试是有代价的:滑动窗口自注意的简单实现可能是计算量大的；采用循环变速 [42] 等先进方法，可以优化速度，但系统在设计上变得更加复杂。另一方面，具有讽刺意味的是，卷积神经网络已经满足了许多这些期望的性质，尽管是以一种简单、无多余的方式。ConvNets 似乎失去动力的唯一原因是(分级) transformer 在许多视觉任务上超过了它们，而性能差异通常归因于 transformer 的卓越 scaling 行为，其中多头自注意是关键的组成部分。

与过去十年中逐步改进的 ConvNets 不同，Vision transformer 的采用是一个阶段性的改变。在最近的文献中，比较两者时通常采用系统级的比较 (例如，Swin Transformer 和 ResNet)。卷积神经网络 (ConvNets) 和分层视觉 transformer (hierarchical vision transformer) 在不同的同时也变得相似：它们都具有相似的归纳偏差，但在训练过程和宏观/微观层次架构设计上存在显著差异。在本研究中，研究了卷积神经网络和变形神经网络的架构区别，并尝试在比较网络性能时识别混淆变量。本文的研究旨在弥补前 ViT 和后 ViT 时代卷积神经网络之间的差距，并测试纯卷积神经网络能够达到的极限。

为了做到这一点，本文从标准 ResNet (如 ResNet50) 开始，训练一个改进的程序。本文逐步将架构现代化，以构建一个分层的视觉 Transformer (例如 Swin-T)。本文的探索是由一个关键问题指导的：Transformer 中的设计决策如何影响卷积神经网络的性能? 在此过程中，本文发现了导致性能差异的几个关键因素。因此，本文提出了一组称为 ConvNeXt 的纯 ConvNets。本文评估了 ConvNeXts 在各种视觉任务上的表现，如 ImageNet 分类、在COCO 上的对象检测/分割以及在 ADE20K 上的语义分割。令人惊讶的是，完全由标准 ConvNet 模块构建的 ConvNeXts，在所有主要基准上的准确性、可伸缩性和鲁棒性都优于 transformer。ConvNeXt 保持了标准 ConvNets 的效率，而且训练和测试都是完全卷积的，这使得它的实现非常简单。

本文的观察和讨论能够挑战一些普遍的信念，并鼓励人们重新思考卷积在计算机视觉中的重要性。

2. ConvNeXt 设计思路

本文最原始的动机，是为了探索和研究一种结构，这种结构能够遵循 Swin Transformer 的不同层次的设计，同时保持网络作为标准 ConvNet 的简单性。

为此，作者的起点是 ResNet-50 模型。

首先，在训练 vision Transformers 相同的训练技术上训练 ResNet-50。注意，这里的 ‘训练技术’ （Training Techniques） 与原始 ResNet-50 论文提出的训练技术是不同的。作者发现，新训练的结果要比原先的结果要好很多。

因此，作者以这个新的训练技术为 baseline，又训练了 5 种设计理念，总结为：

1) macro design, # 宏观设计

2) ResNeXt,

3) inverted bottleneck, # 逆瓶颈（ResNet 的瓶颈结构中，通道数在中间层会缩小，而逆瓶颈指的是通道数在中间层增多，就像 Transformer 中的 MLP 一样）

4) large kernel size, # 大卷积核

5) various layer-wise micro designs # 微观设计

下图 2 展示了作者研究过程，每个步骤所能实现的过程和结果。

由于网络复杂性与最终性能密切相关，在上述的研究探索过程中，每种模型的 FLOPs 尽可能保持一致，尽管在中间步骤中 FLOPs 可能高于或低于参考模型。

上述所有的模型都在 ImageNet-1K 上进行训练和评估。

Figure 2. We modernize a standard ConvNet (ResNet) towards the design of a hierarchical vision Transformer (Swin), without introducing any attention-based modules. The foreground bars are model accuracies in the ResNet-50/Swin-T FLOP regime; results for the ResNet-200/Swin-B regime are shown with the gray bars. A hatched bar means the modification is not adopted. Detailed results for both regimes are in the appendix. Many Transformer architectural choices can be incorporated in a ConvNet, and they lead to increasingly better performance. In the end, our pure ConvNet model, named ConvNeXt, can outperform the Swin Transformer.

下面介绍本工作中， Training Techniques 以及上述 5 个设计理念。

2.1 Training Techniques 训练技术

除了网络架构的设计，训练过程也会影响最终性能。

Vision Transformers 不仅带来了一套新的模块和架构设计决策，而且在视觉应用中，引入了不同的训练技术 (如 AdamW 优化器) 。这主要涉及优化策略和相关的超参数设置。

因此，作者探索的第一步是用 vision Transformer 训练程序训练一个 baseline 模型，在本例中是ResNet50/200。

最近的一篇论文 [ResNet strikes back: An improved training procedure in timm] 阐述了一组现代训练技术如何显著提高简单 ResNet-50 模型的性能。

作者在本文使用了一个接近 DeiT [68] 和 Swin Transformer [42] 的训练方法，包括：

1. 训练 ResNets 从最初的 90 个 epoch 扩展到 300 个 epoch；

2. 训练过程使用 AdamW 优化器 [43]；

3. 数据增强技术 (如 Mixup [85]、Cutmix [84]、RandAugment [12]、Random Erasing [86]) ；

4. 正则化方案 (包括 Random Depth [33] 和 Label Smoothing [65])。

【注】使用的整套超参数可以在原文的附录 A.1 中查看。

就其本身而言，这种增强训练方法将 ResNet-50 模型的性能从 76.1%[1] 提高到 78.8%(+2.7%)，这意味着传统卷积神经网络和 vision Transformers 之间的性能差异很大一部分可能是由于训练技术。

在后面的整个研究过程中（作者称之为 “modernization” 过程），都将使用这个固定的训练配方，使用相同的超参数。ResNet-50 方法的每一个报告的准确性都是由三种不同的随机种子（random seeds）训练获得的平均值（我的理解是，由于 CNN 中参数的初始化对网络性能是有影响的，为了准确地、客观地说明每种改进技术和设计真正的作用，相同的实验做三次，结果取平均，这样更合理）。

2.2. Macro Design: 宏观设计

作者分析了 Swin transformer 的宏网络设计。Swin transformer 遵循 ConvNets [26,62]，采用多阶段设计，其中每个阶段都有不同的特征图分辨率。在本宏观设计中，作者从两个有趣的设计考虑改进：stage compute ratio 和“stem cell” 结构。

1. Changing stage compute ratio

stage compute ratio 是指网络结构在每次下采样后 block 个数的比例。举个例子，原来的 ResNet-50 结构中，每次特征下采样后，ResNet block 的个数是 (3, 4, 6, 3)。

ResNet 中的这种跨阶段的计算分布最初的设计很大程度上是基于经验的。

在 Swin-T 中，也遵循了 stage 结构的原理，但阶段计算比例略有不同，为 1:1:3:1。对于更大的 Swin Transformer，比例是1:1:9:1。

本文提出的 ConvNeXts 将每个阶段的块数从 ResNet-50 中的 (3,4,6,3) 调整为 (3,3,9,s3)，这也将FLOPs 与 Swin-T 对齐。

这个改进，将模型的精度从 78.8% 提高到 79.4%。

值得注意的是，研究人员已经对计算的分布进行了深入的研究 [50,51]，可能存在更优化的设计。

本文后续的研究中，将使用 (3,3,9,s3) 这个阶段计算比率。

2. Changing stem to “Patchify”

stem cell 的设计，是考虑在网络开始时如何处理输入的图像。

在标准 ResNet 中，stem cell 包含一个 7×7 卷积层，stride 2，然后是一个最大池化层，其结果是输入图像的向下采样 4 倍。

在 vision transformer 中，使用了一种更激进的 “patchify” 策略作为 stem cell，它对应于较大的核大小 (例如核大小= 14 或16) 和非重叠卷积。

Swin Transformer 使用了类似的 “patchify” 层，但 patch 的大小更小，为 4，以适应体系结构的多阶段设计。

本文提出的 ConvNeXts，将 ResNet 类型的 stem cell 替换为一个 “patchify” 层，该层使用 4×4, stride 4 卷积层实现。

这个改进，将网络的准确率从 79.4% 提高到 79.5%。

这表明 ResNet 中的 stem cell 可以被一个更简单的 “patchify” 层取代

本文后续的研究中，将使用 “patchify stem” (4×4 non-overlap convolution)。

2.3. ResNeXt-ify：ResNeXt 化设计

作者在这部分考虑了 ResNeXt 的思想，它比普通的 ResNet 相比，更好地平衡了 FLOPs 与准确性（FLOPs/accuracy trade-off）。

ResNeXt 的核心部分是分组卷积，其中卷积滤波器被分成不同的组，扩大宽度。更准确地说，ResNeXt 对瓶颈块中的 3x3 conv 层使用了分组卷积。因此，可以通过扩大网络宽度来弥补容量损失。

作者在提出的 ConvNeXts 使用深度卷积（Depth-wise Conv.），这是分组卷积的一种特殊情况，分组的数量等于通道的数量。Depth-wise conv 在 MobileNet [32] 和 Xception [9] 的工作中得到推广。

作者注意到，深度卷积类似于自注意力中的加权和操作，其操作基于每个通道，即只在空间维度上混合信息。

深度卷积的使用有效地减少了网络的 FLOPs ，但精度也减少了。

在 ResNeXt 中，为了弥补上述 depth-wise conv. 带来的精度降低，提出的策略是将原来的 ResNet 第一层通道数从 64 增加到 96。

为了弥补上述 depth-wise conv. 带来的精度降低问题，作者在提出的 ConvNeXts 中，网络宽度增加到与 Swi-T 相同，即通道数从 64 个增加到 96 个。

这使得网络性能达到 80.5%，FLOPs 增加 (5.3G)。

本文后续的研究中，将采用 ResNeXt 设计。

2.4. Inverted Bottleneck：逆瓶颈

在 Transformer block 中，一个重要的设计是在其中的 MLP block 中，使用了 Inverted Bottleneck，维度比输入扩大的 4 倍。

这种逆瓶颈的思路，是在 MobileNetV2 中提出的。这种结构的有效性在工作 [66,67] 中也得到了证实。

因此，作者在提出的 ConvNeXts 中使用了逆瓶颈的设计。

图 3 (a) 到 (b) 展示了这种结构。尽管深度卷积层的 FLOPs 增加了，但这一变化使整个网络 FLOPs 减少到 4.6G，因为下采样 residual blocks 的 shortcut 1×1 conv 层的 FLOPs 显著减少（图 3（b）紫色模块）。

这种改进，略微提高了网络性能 (从80.5%提高到80.6%)。

在 ResNet-200 / Swin-B 模式中，这一步带来了更多的收益 (81.9%至82.6%)，同时也减少了 FLOPs。

本文后续的研究中，将采用逆瓶颈的设计。

Figure 3. Block modifications and resulted specifications. (a) is a ResNeXt block; in (b) we create an inverted bottleneck block and in (c) the position of the spatial depthwise conv layer is moved up.

2.5. Large Kernel Sizes：大卷积核

作者继续将重点关注在卷积核的尺度上。Vision Transformers 最与众不同的一个方面是其非局部自注意力，这使得每一层都有一个全局的接收域。

虽然过去 ConvNets 已经使用了大的卷积核，但黄金标准 (由 VGGNet 推广的) 是堆叠 3x3 卷积核的卷积层，这在目前的 GPU 上具有高效的硬件实现。虽然 Swin transformer 重新将局部窗口引入到自注意力模块中，但窗口的大小至少是 7x7，明显大于 ResNe(X)t 的 3x3。

因此，作者在提出的 ConvNets 中使用大卷积核的卷积。具体地包括以下两个技术：

1. Moving up depthwise conv layer

使用大卷积核，作者首先上移了深度卷积层的位置，即从图 3 (b) 的位置，移到 (c)。

这种技术在 Transformer 中也很明显：多头注意力（MSA）模块被放置在 MLP 层之前。由于 ConvNeXts 有一个逆瓶颈模块，这自然的要求深度卷积层上移：因为，复杂、低效的模块 (如 MSA，大卷积核) 将有更少的通道，而高效、密集的 1×1 层将完成繁重的工作。

这个中间步骤将 FLOPs 降低到 4.1G，但导致性能暂时下降到 79.9%。

2. Increasing the kernel size

作者指出，采用更大的卷积核的好处是显著的。

实验包括 3、5、7、9 和 11 大小的卷积核。网络的性能从 79.9% (3x3) 提高到 80.6%(7x7)，但网络的 FLOPs 基本保持不变。

此外，作者观察到较大卷积核的好处在 7x7 达到饱和点。

在大容量模型中验证了这一发现：当将卷积核大小增加到 7 时，ResNet-200 机制模型不会显示出进一步的增益。

本文后续的研究中，将采用 7x7 的深度卷积。

2.6. Micro Design：微观设计

本节将在微观尺度上研究其他几个架构差异。这些设计大多数都是在层级别上完成的，重点是激活函数和规范化层的特定选择。

1. Replacing ReLU with GELU

NL P和视觉架构之间的一个差异是使用哪种激活函数的细节。

目前有许多激活函数，但 ReLU [46] 由于其简单和高效，仍然广泛应用于卷积神经网络。

在原 Transformer 论文中，ReLU 也被用作激活函数 [72]。

高斯误差线性单元，即 GELU [30]，可以被认为是 ReLU 的平滑变体，在最新的 Transformer 结构中被使用，包括谷歌的 BERT [16] 和 OpenAI 的 GPT-2 [49]，以及最近的 ViT。

作者发现，在ConvNet 中，ReLU 也可以被 GELU 代替，但精度没有变化 (80.6%)。

2. Fewer activation functions

Transformer 和 ResNet 块之间的一个小区别是 Transformer 有更少的激活功能。Transformer 包含一个具有 Q/K/V 的 linear embedding 层、projection 层以及 MLP block 中有两个线性层。而 MLP block 中只有一个激活函数。

相比之下，ConvNets 通常是在每个卷积层后加一个激活函数，包括 1x1 卷积。

因此，作者尝试减少激活函数使用次数，观察其性能是如何变化的。

如图 4 所示，作者在提出的 ConvNeXts 中，复制了 Transformer block 中的样式，在 Residul block 中，除了两个 1x1 层之间保留了 GELU 层，其余层均消除了 GELU 层。

该改进方法将结果精度提高了0.7%，达到81.3%，与 Swin-T 的性能相当。

本文后续的研究中，将使用一个 GELU 激活。

3. Fewer normalization layers

Transformer blocks 通常也有较少的规范化层。

作者在提出的 ConvNeXts 中，去掉了两个 BatchNorm (BN) 层，在 conv 1 × 1 层之前只留下一个BN 层。

这进一步提升了其 81.4% 的精度，已经超过了 Swi-T。

值得注意的是，在提出的 ConvNeXts 中每个 block 的规范化层甚至比 transformer 还要少，因为，作者发现在块的开始添加一个额外的 BN 层并不能改善性能。

4. Substituting BN with LN

BatchNorm [35] 是卷积神经网络的重要组成部分，因为它提高了收敛性并减少了过拟合。然而，BN 也有许多错综复杂的地方，会对模型的性能产生不利影响 [79]。一些工作曾多次尝试开发替代的标准化技术 [57,70,78]，但 BN 仍然是大多数视觉任务的首选方法。

另一方面，在 transformer 中使用了更简单的 Layer Normalization [5] (LN)，从而在不同的应用场景中获得了良好的性能。然而，直接用 LN 代替原来 ResNet 中的 BN 会导致性能下降 [78]。

但作者还是在提出的 ConvNeXts 中，用 LN 代替 BN。

作者观察到卷积神经网络模型在 LN 的训练中没有任何困难；实际上，该算法的性能略好，达到了81.5% 的精度（又提高了）。

本文后续的研究中，将使用一个 LayerNorm 作为每个 residual block 的规范化选择。

5. Separate downsampling layers

在 ResNet 中，空间下采样由每个 stage 开始时的 residual block 实现的，即使用 3×3 卷积，其中 stride=2 (在 short-cut 连接处使用 1×1 conv with stride 2)。

在 Swin transformer 中，在各个 stage 之间添加了一个单独的下采样层。

作者在提出的 ConvNeXts 中，使用 2×2 conv 层 with stride=2 进行空间下采样。

令人惊讶的是，这种改变会导致不同的训练。进一步的研究表明，在空间分辨率发生变化的地方增加归一化层有助于稳定训练。这包括几个也在 Swin transformer 中使用的 LN 层：一个是在每个下采样层之前，一个在 stem 之后，一个在最终的全局平均池之后。

这个方法可以将准确率提高到82.0%，显著超过 Swin-T 的 81.3%。

本文后续的研究中，将使用单独的下采样层。

至此，完成了 ConvNeXt 的最终设计！

ResNet、Swin 和 ConvNeXt block 结构的比较如图 4 所示。ResNet-50、Swin-T 和 ConvNeXt-T 的详细架构规范的比较见表 9。

Figure 4. Block designs for a ResNet, a Swin Transformer, and a ConvNeXt. Swin Transformer’s block is more sophisticated due to the presence of multiple specialized modules and two residual connections. For simplicity, we note the linear layers in Transformer MLP blocks also as “1×1 convs” since they are equivalent.

Table 9. Detailed architecture specifications for ResNet-50, ConvNeXt-T and Swin-T.

6. Closing remarks 结束语

作者也指出，到目前为止讨论的设计选项都不是新颖的，它们都是单独研究的，但在过去的十年中没有集体研究。

作者提出的 ConvNeXt 模型与 Swin Transformer 有大致相同的 FLOPs, #params., throughput, 和 memory use，但不需要特殊的模块，如移动窗口注意力或相对位置偏差。

前面描述发现是令人鼓舞的，但尚未完全令人信服，作者认为自己的探索迄今为止仅限于小规模，但 vision transformer 的 scaling 行为是真正区别它和 ConvNet 的地方。

此外，卷积神经网络能否在诸如对象检测和语义分割等下游任务上与 Swin transformer 竞争，是计算机视觉从业者关注的中心问题。

因此，作者在实验部分，研究了在数据和模型大小方面扩大 ConvNeXt 模型，并在不同的视觉识别任务中评估它们。

实验部分此处略。

你可能感兴趣的:(Transformer,deep,learning,Transformer,ConvNeXt,深度学习,人工智能,计算机视觉)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts