程序员奇奇

深度学习中的各种数据增强方法大全

随着深度学习在计算机视觉的广泛应用，以卷积神经网络为代表的深度学习模型取得了突破性的进展。然而，直至今日，尽管提出了以 ViT 为代表的新一代视觉网络架构，但数据问题仍然是构建深度学习模型最常见的挑战之一。在实际的应用场景中，足量且高保真的优质数据集通常是可遇不可求的，一方面费钱费时费力不说，由于隐私保护和极端概率问题，数据集的获取变得尤为困难。因此，一种低成本且有效的方法便是利用数据增强来减少对训练数据的依赖，从而帮助开发人员更好更快地构建高精度的 AI 模型。

本文的大纲：

数据增强的定义

数据增强的作用

数据增强的方式

数据增强的定义

数据增强通常是依赖从现有数据生成新的数据样本来人为地增加数据量的过程。这包括对数据进行不同方向的扰动处理或使用深度学习模型在原始数据的潜在空间(latent space)中生成新数据点从而人为的扩充新的数据集。

这里我们需要区分两个概念，即增强数据和合成数据：

合成数据：指在不使用真实世界图像的情况下人工生成数据，合成数据可由 GAN 或者现如今大火的 AGI 技术 Diffusion Model 产生；

增强数据：从原始图像派生而来，并进行某种较小的几何变换（例如翻转、平移、旋转或添加噪声等）或者色彩变换（例如亮度、对比度、饱和度或通道混洗等），以此来增加训练集的多样性。

数据增强的作用

省钱 · 省时 · 省心

在实际的应用场景中，数据集的采集、清洗和标注在大多数情况下都是一个非常昂贵且费时费力且乏味的事情。有了数据增强技术，一方面可以减轻相关人员的工作量，另一方面也可以帮助公司削减运营开支。此外，有些数据由于涉及到各种隐私问题可能用钱都买不到，又或者一些异常场景的数据几乎是极小概率时间，这时候数据增强的优势便充分的体现出来了。

提升模型性能

众所周知，卷积神经网络对平移、视点、大小或光照均具有不变性。因此，CNN 能够准确地对不同方向的物体进行分类。在深度学习中，CNN 通过对输入图像进行卷积运算来学习图像中的不同特征，从而在计算机视觉任务上表现非常出色。随着 ViT 的提出，一系列 Vision Transformer 模型被提出并被广泛地应用。然而，无论是 CNN 还是 Transformer，均离不开数据的支持。特别是，当数据量较小时 CNN 容易过拟合，Transformer 则无法学习到良好的表征。

数据增强的方式

数据增强方式大致可分为两类：基础数据增强和高级数据增强。

Image data augmentation taxonomy

基础数据增强方法

Image Manipulation

图像处理(Image Manipulation)是指在图像中对其位置或颜色所做的更改：

位置操作是通过调整像素的位置来进行的;

颜色操作是通过改变图像的像素值来进行的。

Overview of the geometric data augmentations

首先介绍下几何数据增强(Geometric Data Augmentation)，它是指对图像几何形状所做的更改。几何指的是位置，比如以一定角度移动等。这种技术改变了图像中像素值的位置，例如旋转、平移和剪切。主要包含以下三种：

Rotation

旋转，其让图像在 0 到 360 度之间旋转。此处旋转度数是一个超参数，应该根据实际需要选择。举个例子，就像大家最熟悉的 MNIST 一样，我们不能旋转 180 度，不然数字 6 旋转 180 就变成 9，这就离谱了。

Translation

平移，它是另一种几何类型的数据增强，通过向上、向下、向右或向左移动图像以提供不同的视图。

Shearing

错切，其字面意思是沿轴扭曲图像。错切是一种数据增强技术，可以将图像的一部分向一个方向移动，而另一部分则向相反方向移动。从技术上讲，它分为两类，即沿x轴切和y轴切。对于 x 轴，图像的顶部沿一个方向移动，底部沿完全相反的方向移动。而在 y 轴中，图像的左侧部分沿一个方向移动，右侧部分沿相反方向移动。

Overview of the non-geometric data augmentations

其次，我们为大家介绍下非几何数据增强(Non-Geometric Data Augmentations)，这种增强方式侧重于图像的视觉外观而不是其几何形状。例如噪声注入、翻转、裁剪、调整大小和色彩空间操作是均是非几何增强技术的范畴。下面介绍一些经典的方法：

Flipping

翻转，它是一种水平或垂直翻转图像的数据增强技术，几乎会应用在许多视觉任务上。一般来说，我们常用的是水平翻转，垂直翻转在大多数情况下会导致目标歧义，例如一个人翻转过来就很不协调和自然，当然还是那句话，根据你的实际应用场景调整。

Cropping and resizing

裁剪，属于另一种数据增强技术，常用作预处理增强。使用随机裁剪或中心裁剪作为数据增强。该技术会减小图像的大小，然后执行调整大小以匹配图像的原始大小，同时不会平滑图像的标签。

Noise Injection

注入噪声是另一种数据增强技术，它有助于神经网络学习稳健的特征，对抵御对抗性攻击非常有帮助。

Color Space

一般来说，图像通常是由 RGB 三颜色通道组成的。这里如果我们单独操纵每个通道值以控制亮度也是一种数据增强方式，有时也称为光度增强。这种增强有助于避免模型偏向 lightning 条件。执行颜色空间增强的最简单方法是隔离任何通道并添加 2 个填充任何随机值或 0 或 255 的通道。颜色空间常用于照片编辑应用程序，即用于控制亮度或暗度。

Jitter

扰动，是一种通过随机改变图像的亮度、对比度、饱和度和色调的数据增强方式。对于这四个是超参数，我们应仔细选择它们的取值范围。例如，如果我们不小心多度提高了肺部疾病检测的X光图像亮度，这会使肺部在X光中变白混杂，对疾病诊断实际是没有帮助的。

Kernel Filters

这是一种用来锐化或模糊图像的数据增强方式。一开始，我们可以滑动大小为 n x n 的窗口 Kernel 或高斯模糊过滤器和边缘过滤器的矩阵。高斯模糊滤镜可以使图像变得更加模糊，而边缘滤镜则使图像的水平或垂直边缘锐化。

紧接着，我们继续介绍第三种基于图像擦除的数据增强方式(Image Erasing Data Augmentations)：

Overview of the Mixup, Cutout, and CutMix

Cutout[1]

Cutout 是通过在训练期间随机擦除子区域并在图像中填充 0 或 255 的一种数据增强技术。

Random erasing[2]

Random erasing examples for different tasks

Random erasing 是一种像剪切一样随机擦除图像中子区域的一种增强方式。但它也随机决定是否屏蔽，并决定屏蔽区域的纵横比和大小。例如，我们可以在人脸识别任务中，通过这项数据增强技术来模拟戴口罩的效果。

Hide-and-Seek[3]

捉迷藏(Hide-and-Seek)数据增强的关键思想是将图像划分为随机大小的均匀正方形，并随机删除随机数量的正方形。当重要信息被隐藏时，它迫使神经网络学习相关特征。在每个epoch，它都会给出图像的不同视图。

An example of Hide-and-Seek augmentation

GridMask[4]

最后，我们向大家介绍基于网格掩码的数据增强方式。先前的方法尝试解决随机删除可能会存在完全擦除对象或删除上下文信息区域的问题。为了在这些问题之间进行权衡，GridMask 创建统一的掩码，然后将其应用于图像，如下图所示：

GridMask augmentation

此图显示了 GridMask 增强的过程，具体的做法是生成一个掩码，然后将其与输入图像相乘。

Image Mixing Data Augmentations

图像混合数据增强在过去几年一直是一个热门话题。图像混合数据增强是关于将图像与其他图像或相同图像混合。在本文中，我们将其大致分为两类，即单图像混合(Single image mixing)增强和非单图像混合(Non-single image mixing)增强。

首先，第一部分我们先介绍下基于单图像混合的数据增强方式。单一图像混合技术顾名思义便是仅使用一个图像，并从不同的视角对其进行处理。最近在单图增强方面做了很多工作，比如LocalAugment、SelfAugmentation、SalfMix等，下面分别为大家介绍下。

Local Augment[5]

An example of Global and Local Rotation Image

Local Augment，即局部增强的原理是将图像切分成小块，并在每个小块上应用不同类型的数据增强，目的是潜在地改变目标偏差属性，但产生显着的局部特征，如上图所示。虽然这种增强并不主宰全局结构，但提供了非常多样化的图像特征，这对于神经网络以更通用的方式学习局部特征至关重要。

Self Augmentation[6]

An example of self augmentation

在 Self Augmentation 中，图像的随机区域会被裁剪并随机粘贴到图像中，以提高小样本学习的泛化能力。

SalfMix[7]

SalfMix 提出的背景主要是关注是否可以泛化基于单图像混合增强的神经网络？为此，其思想是找到图像的第一个显着部分来决定应该删除哪个部分以及应该复制哪个部分。

Conceptual comparison between SalfMix method and other single image-based data augmentation methods

如上图所示，SalfMix 是通过显着性图将图像中显著的区域裁剪出来并放入非显着区域。

KeepAugment[8]

This image shows the example of KeepAugment with other augmentations

引入 KeepAugment 是为了防止分布偏移降低神经网络的性能。KeepAugment 的想法是通过保留图像的显着特征和增强非显着区域来提高保真度。其中，被保留的特征进一步允许在不改变分布的情况下增加多样性。

YOCO[9]

An example of YOCO augmentation

YOCO，即You Only Cut Once，它可以从部分信息中识别对象并提高增强的多样性，从而鼓励神经网络表现得更好。YOCO 制作了两张图像，每张都应用了一个增强，然后将每张图像连接成一张图像。YOCO 易于实现，且不会引入任何参数，同时也易于使用。

Cut-Thumbnail[10]

Comparison between existing data augmentation methods with CutThumbnail

Cut-Thumbnail，即缩略图，是一种新颖的数据增强，它将图像调整到一定的小尺寸，然后用调整后的图像随机替换图像的随机区域，旨在减轻网络的形状偏差。Cutthumbnail 的优点是它不仅保留了原始图像，而且在调整后的小图像中保持全局。

Cut-Thumbnail

此图像显示了缩略图的缩小图像示例。其方式是将图像缩小到一定尺寸 112×112 或 56×56 后，尽管丢失了很多局部细节，但图像中的目标(狗)仍然可以识别。

最后一部分我们向大家介绍非单图像的混合数据增强(Non-Single Image Mixing Data Augmentations)方式，这块涉及的内容比较丰富，包括大家所熟悉的 Mixup、CutMix、CopyPaste 等混合增强技术，下面让我们一起看看吧！

Overview of the Mixup, Cutout, and CutMix

Mixup[11]

Mixup 是根据混合因子(alpha)来混合任意两个随机图像，这些图像的相应标签也以相同的方式混合。混合数据增强不仅在准确性方面而且在鲁棒性方面都可持续地提高了性能。

CutMix[12]

CutMix 解决了信息丢失和区域丢失问题。它的灵感来自 Cutout，其中任何随机区域都用 0 或 255 填充，而在 cutmix 中，不是用 0 或 255 填充随机区域，而是用另一个图像的补丁填充该区域。相应地，它们的标签也根据混合的像素数按比例混合。

SaliencyMix[13]

An example of SaliencyMix augmentation

SaliencyMix 基本上解决了 Cutmix 的问题，并认为用另一个补丁填充图像的随机区域并不能保证补丁具有丰富的信息，因此混合未保证补丁的标签会导致模型学习关于图像的不必要信息修补。为了解决这个问题，SaliencyMix 首先选择图像的显着部分并将其粘贴到随机区域或另一幅图像的显着或非显着区域。

SaliencyMix data augmentation procedure

上面这张图展示了该方法的实现过程。

Puzzle Mix[14]

Puzzle Mix 提出了一种拼图混合数据增强技术，该技术侧重于灵活地使用图像的显着信息和基本统计数据，目的是打破神经网络对现有数据增强的误导监督。

A visual comparison of the mixup methods.

uzzle Mix 确保包含足够的目标类信息，同时保留每个样本的局部统计信息。

SnapMix[15]

SnapMix 是一种基于语义比例的混合数据增强，它利用类激活图来降低标签噪声水平。SnapMix 根据实际参与增强图像的显着像素创建目标标签，确保增强图像和混合标签之间的语义对应。

A visual Comparison of Mixup, CutMix, and SnapMix

该图给出了一个基本示例，可以看出，与 CutMix 和 Mixup 相比，SnapMix 生成的标签在视觉上更符合混合图像的语义结构。

FMix[16]

FMix 也是一种混合样本数据增强（MSDA），利用随机二分类掩码。这些随机二分类掩码是通过对从傅立叶空间获得的低频图像应用阈值来获取的。一旦获得掩码，一个颜色区域将应用于其中一个输入，另一个颜色区域将应用于另一个输入。整体流程如下图所示：

Example masks and mixed images from CIFAR-10 for FMix

MixMo[17]

MixMo 侧重于通过子网络学习多输入多输出。该方法的主要动机是采用更可靠的机制代替直接的隐藏求和操作。MixMo 的具体做法是将 M 个输入嵌入到共享空间中，将它们混合并将它们传递到更深的层进行分类。

This image shows the overview of MixMo augmentation

StyleMix[18]

StyleMix 针对以前的方法问题，即不区分内容和样式特征。为了解决这个问题提出了两种方法 styleMix 和 StyleCutMix，这是第一个非常详细地分别处理图像的内容和样式特征的工作，并且它在流行的基准数据集上显示出令人印象深刻的性能。

A Visual comparison of StyleMix and StyleCutMix with Mixup and CutMix

RandomMix[19]

RandomMix 可用于提高模型的泛化能力，它从一组增强中随机选择混合增强并将其应用于图像，使模型能够查看不同的样本。整体演示如下图所示：

An illustrative example of RandomMix

MixMatch[20]

MixMatch 是一种应用于半监督学习的数据增强技术，其将单个图像增加 K 次并将所有 K 个图像传递给分类器，对它们的预测进行平均，最后，通过调整它们的分布温度项来增强它们的预测。

Diagram of the label guessing process used in MixMatch

ReMixMatch[21]

ReMixMatch 是混合匹配的扩展，通过引入分布对齐和增强锚定使先前的工作变得高效。分布对齐任务是使未标记数据的预测边缘分布接近 ground truth 的边缘分布，并鼓励未标记数据的预测边缘分布接近 ground truth 标签的边缘分布。增强锚定将输入的多个强增强版本提供给模型，并鼓励每个输出接近同一输入的弱增强版本的预测。

ReMixMatch

ReMixMatch 使用弱增强图像（中间绿色部分）的预测来预测同一图像（图中蓝色部分）的强增强。

FixMatch[22]

FixMatch 通过在有限的标记数据上进行训练，然后使用经过训练的模型将标签分配给未标记数据。Fixmatch 首先将伪标签分配给概率高于某个阈值的未标记图像。该模型被迫对未标记图像的强增强版本进行预测，以使用交叉熵损失将其预测与伪标签相匹配。

FixMatch

AugMix[23]

AugMix 是一种简单有效的数据增强，可减少训练和测试（未见）数据分布之间的差距。AugMix 操作以相应的随机增强幅度执行，最后，所有这些图像被合并以生成一个新图像，该图像广泛探索图像周围语义等效的输入空间。

AugMix

如上图所示，在三个分支中分别进行了三个操作，最后，将所有图像混合生成新图像，这有利于提升模型的鲁棒性。

Copy-Paste[24]

Copy-Paste] 只是将一个图像的掩码实例复制并粘贴到另一个图像，其实现起来非常简单，但效果出众，特别是对于小目标检测来说。当然，我们也可以采用 BBox 级的实例来实现。

Copy-Paste

上图展示了两个图像的实例以不同的比例相互粘贴。

Mixed-Example[25]

如今，最先进的非标签保留数据增强技术已经使用两个示例的线性组合显示出有希望的结果。Mixed-Example 集中讨论两个问题：

为什么这些方法有效？

若通过提出新的增强，这种线性组合重要吗？

Mixed-Example

上图给出了改进的混合示例执行的线性方法和广义增强的视觉比较。

RICAP[26]

RICAP，即随机图像裁剪和修补，是一种新的数据增强技术，它切割和混合四张图像而不是两张图像，并且图像的标签也被混合。

A conceptual explanation of the RICAP data augmentation

CutBlur[27]

CutBlur 探索和分析了现有的超分辨率数据增强技术，并提出了另一种新的数据增强技术，通过切割高分辨率图像块并粘贴到相应的低分辨率图像，反之亦然。Cutblur 在超分辨率方面表现出色。

A visual comparison between High resolution, low resolution and CutBlur

下面是它的实现原理示意图：

An Schematic illustration of CutBlur operation

ResizeMix[28]

ResizeMix 是一种将数据与保留的对象信息和真实标签混合的数据增强方法，其通过直接以四种不同的方式剪切和粘贴源数据以针对图像。这里，四种不同的方式，包括显着部分、非部分、随机部分或调整源图像大小来修补，它主要解决了两个问题：• 如何从源图像中获取补丁？• 将源图像的补丁粘贴到目标图像的什么位置？

ResizeMix

此外，ResizeMix 发现显着性信息对于促进混合数据扩充并不重要。

ClassMix[29]

ClassMix 是一种用于半监督学习的基于分割的数据增强方法。传统的数据增强对语义分割并不像图像分类那样有效。ClassMix 通过在考虑对象边界的同时利用网络预测，通过混合未标记样本来扩充训练样本。

ClassMix

CDA[30]

CDA，即 Context Decoupling Augmentation，是一种用于弱监督语义分割的上下文解耦增强技术，从而解决 WSSS 领域传统数据技术性能不佳的问题，这些通过增加相同上下文数据语义样本不会在对象区分中贡献太多价值。例如，对于图像分类任务来说，目标识别是由于目标本身及其周围环境，这不鼓励模型只关注当前目标，而要结合上下文。

为了打破这一点，CAD 使特定对象出现的位置多样化，并引导网络打破对象和上下文信息之间的依赖关系。在这种情况下，它还提供增强和网络焦点到对象实例而不是对象实例和上下文信息的方式。

CDA

ObjectAug[31]

ObjectAug 是一种用于语义分割的对象级增强，解决了混合图像级数据增强策略的问题，以前的策略无法用于分割，因为对象和背景是耦合的，其次对象的边界由于它们与背景的固定语义联系而没有被增强。为了缓解这个问题，首先，它借助语义标签将对象和背景从图像中分离出来，然后使用翻转和旋转等流行的数据增强技术对每个对象进行增强。由于这些数据增强而导致的像素变化可以使用图像修复来恢复。最后，对象和背景耦合以创建增强图像，从而有效的提升分割的性能。

ObjectAug

高级数据增强

高级数据增强的一个典型代表便是自动数据增强，其目标是从训练数据中找到数据增强策略。它将寻找最佳增强策略的问题转化为离散搜索问题，由搜索算法和搜索空间组成，主要包含四部分：

基于强化学习的数据增强(Reinforcement learning data augmentation)

基于非强化学习的数据增强(Non-Reinforcement learning data augmentation)

基于风格迁移的数据增强(Neural Style Transfer)

基于特征空间的数据增强(Feature space data augmentations)

下面简单介绍下这两部分。

基于强化学习的数据增强

AutoAugment[32]

AutoAugment 的目标是通过自动搜索策略找到最好的数据扩充而不是通过手动进行数据扩充。为了解决这个限制，其设计了搜索空间并具有由许多子策略组成的策略。每个子策略都有两个参数，一个是图像处理函数，第二个是概率和大小。这些子策略是使用强化学习作为搜索算法找到的，整体流程如下所示：

AutoAugment

Fast Autoaugment[33]

Fast Autoaugment 解决了 AutoAugment 需要花费大量时间才能找到最佳的数据增强策略的问题。该方法的解决方案是通过利用基于密度匹配的高效搜索策略找到更优的数据扩充，从而减少了高阶训练时间。

An overall procedure of augmentation search by Fast AutoAugment algorithm

Faster AutoAugment[34]

Faster AutoAugment 旨在非常高效地找到有效的数据增强策略，其基于可区分的增强搜索策略。此外，它不仅为许多具有离散参数的转换操作估计梯度，而且还提供了一种有效选择操作的机制。最终，它引入了一个训练目标函数，旨在最小化原始分布和增广分布之间的距离，该函数也是可微的。需要注意的是，其增强的参数是在反向传播期间更新的，整体流程图定义如下：

An Overview of the Faster AutoAugment augmentation

RAD[35]

RAD，即增强数据强化学习，其易于插入有效提升了强化学习算法的性能。RAD 主要考虑两个问题：

学习数据效率；

新环境的泛化能力；

此外，它表明传统的数据增强技术使 RL 算法能够在基于像素的控制和基于状态的控制方面胜过复杂的 SOTA 任务，下面是它的总体流程图：

An overview of different augmentation investigated in RAD

MARL[36]

MARL，即多代理强化学习，是一种基于多代理协作的局部补丁自动增强方法，这是第一个使用强化学习找到补丁级别数据增强策略的方法。MARL 首先将图像分成小块，然后共同为每个小块找到最佳数据增强策略.

An Illustration of different automated augmentation policies for MARL

LDAS[37]

LDAS 建议使用自动增强来学习目标检测的最佳策略。它解决了目标检测增强的两个关键问题：

分类学习策略不能直接应用于检测任务，如果应用几何增强，它会增加处理边界框的复杂性；

与设计新的网络架构相比，数据增强增加的价值要少得多，因此受到的关注较少，但应谨慎选择用于目标检测的增强

下图展示了基于此数据扩充的一些子策略：

Different data augmentation sub-policies explored

[Scale-Aware Automatic Augmentation](https://arxiv.org/abs/2103.17220 "Scale-Aware Automatic Augmentation"

，即Scale-Aware Automatic Augmentation，是一种用于目标检测的数据增强策略。首先，它定义了一个搜索空间，其中图像级和框级数据增强为尺度不变性做好了准备；其次，这项工作还提出了一种新的搜索度量，名为有效且高效地搜索增强的帕累托比例平衡。

Example of scale-aware search space which includes image level and box-level augmentation

ADA[38]

ADA 提供了一种系统的方法来从目标检测的角度找到数据增强的最佳对抗性扰动，该方法基于数据的博弈论解释，即纳什均衡。纳什均衡提供了最佳边界框预测器和数据扩充的最佳设计。最优对抗性扰动是指 ground truth 的最差扰动，它迫使框预测器从最困难的样本分布中学习。

Adversarial augmentation

从上图可以看出，ADA 偏向于选择尽可能与 GT 不同但又包含关键对象特征的边界框。

Deep CNN Ensemble[39]

Deep CNN Ensemble 提出了一种新的 R-CNN 模型变体，在训练和评估方面进行了两个核心修改。首先，它使用几个不同的 CNN 模型作为 R-CNN 中的集成器，其次，它通过从 Microsoft COCO 数据集中选择与 PASCAL VOC 一致的子集，巧妙地用 Microsoft COCO 数据增强 PASCAL VOC 训练示例。原理图如下所示：

The proposed schematic diagram

RADA[40]

通过对抗性学习可以获取稳健而准确的目标检测，先前方法展示了当对目标检测任务进行微调时分类器性能从不同的数据增强中获得增益，并且在准确性和稳健性方面的性能没有提高。RADA 提供了一种探索对抗性样本的独特方法，有助于提高性能。为此，它在目标检测器的微调阶段通过探索对抗性样本来增强示例，这被认为是依赖于模型的数据增强。

首先，它从检测器分类和定位层中选择更强的对抗样本，这些样本会随着检测器的变化而变化，以确保增强策略保持一致。该方法在不同目标检测任务的准确性和鲁棒性方面显示出显着的性能提升：

RADA

上图分别展示了 RADA 分别提高了目标检测器在干净图像上的准确性、检测器对自然损坏的鲁棒性以及对跨数据集域偏移的鲁棒性。

PTDA[41]

PTDA，即 Pespective Transformation Data Augmentation，同样也是一种用于目标检测的新数据增强，简称为透视变换，它可以生成以不同角度捕获的新图像。因此，它模仿图像，就好像它们是在相机无法捕获这些图像的特定角度拍摄的一样。该方法在多个目标检测数据集上显示出有效性。

DADA[42]

DADA，Deep Adversarial Data Augmentation，即深度对抗性数据增强，它将数据增强被表述为训练类条件和监督 GAN 的问题。此外，它还引入了新的鉴别器损失，目的是保证数据扩充是真实的，并且扩充样本被迫平等参与并在寻找决策边界时保持一致。

基于非强化学习的数据增强

RandAugment

以前的最佳增强方法大都是一些使用强化学习或一些复杂的学习策略，因此需要花费大量时间才能找到合适的增强方法和确定增强因子。这些方法消除了单独搜索阶段的障碍，这使得训练更加复杂，从而增加了计算成本开销。为了打破这一点，RandAugment 是一种新的数据增强方法，比 AutoAugment 简单又好用。主要思想是随机选择变换，并调整它们的大小：

Example images augmented by RandAugment

基于风格迁移的数据增强

基于风格迁移的数据增强是一种独特的数据增强方式，可以在不改变高层语义的情况下将一幅图像的艺术风格转移到另一幅图像。它为训练集带来了更多多样性。这种神经风格迁移的主要目标是从两张图像生成第三张图像，其中一张图像提供纹理内容，另一张图像提供高级语义内容。下面介绍一些常见的应用。

STaDA[43]

STaDA，Style Transfer as Data Augmentation，顾名思义便是基于风格迁移的数据增强方法，这是一种彻底评估了不同的 SOTA 神经风格转移算法作为图像分类任务的数据增强。此外，它还将神经风格迁移算法与传统的数据增强方法相结合，下面给出相关的示意图：

Overview of the original image and two stylized images by STaDA

NSTDA[44]

NSTDA，Neural Style Transfer as Data Augmentation，是一种将神经风格迁移作为改进 COVID-19 诊断分类的数据增强方法。这项工作显示了循环生成对抗网络的有效性，该网络主要用于神经风格迁移，增强 COVID-19 负 x 射线图像以转换为正 COVID 图像以平衡数据集并增加数据集的多样性。该方法充分表明了使用 Cycle GAN 增强图像可以提高几种不同 CNN 架构的性能。

Overview of generating synthetic covid images from the healthy category

SA[45]

这项工作提出了一种新的数据增强，称为基于风格神经转移的风格增强。SA 随机化颜色、对比度和纹理，同时在训练期间保持形状和语义内容。这是通过选择任意样式传输网络来随机化样式并从多元正态分布嵌入中获取目标样式来完成的。它提高了三个不同任务的性能：分类、回归和域适应。

Overview of Style augmentation applied to an image

从上图可以明显的看出，基于 SA 的数据增强方式可以将形状保留下来，但样式（包括颜色、纹理和对比度）是随机的。

StyPath[46]

StyPath 是一种用于稳健组织学图像分类的风格迁移数据增强策略，旨在减少偏见的风格。

StyPath

AS[47]

这项工作介绍了一种基于深度神经网络的人工系统，可生成具有高感知质量的艺术图像。AS 创建神经嵌入，然后使用嵌入来分离图像的风格和内容，最后再重新组合目标图像的内容和风格以生成艺术图像。

Overview of the styled image by neural algorithm

基于特征空间的数据增强

基于特征空间的数据增强首先将图像转换为嵌入或表示，然后对图像的嵌入执行数据增强，最后再向大家介绍下这部分内容。

Dataset Augmentation in Feature Space[48]

这项工作首先使用编码器-解码器来学习表示，然后在表示上应用不同的变换，例如添加噪声、插值或外推。所提出的方法已经显示出静态和顺序数据的性能改进。

Overview of interpolation and extrapolation between handwritten characters

Feature Space Augmentation for Long-Tailed Data

该方法提出了基于特征空间中的新数据增强，以解决长尾问题并提升代表性不足的类样本。所提出的方法首先在类激活图的帮助下将类特定特征分为通用特征和特定特征。代表性不足的类样本是通过将代表性不足的类的类特定特征与来自其他混淆类的类通用特征注入而生成的。这使得数据多样化，也解决了代表性不足的类别样本的问题。

Left: limited but well-spread data. Right: Without sufficient data

Adversarial Feature Augmentation for Unsupervised Domain Adaptation[49]

生成对抗网络在无监督域适应中显示出可喜的结果，以学习与源域无法区分的目标域特征。这项工作扩展了 GAN 以强制特征提取器成为域不变的，并通过特征空间中的数据增强来训练它，称为特征增强。总的来说，该工作探索了 GAN 在特征层面的数据增强。

FeatMatch[50]

FeatMatch 提出了一种新的 SSL 特征空间数据增强方法，其灵感来自基于图像的 SSL 方法，该方法结合了图像增强和一致性正则化。基于图像的 SSL 方法仅限于传统的数据增强。为了打破这一目标，基于特征的 SSL 方法从复杂的数据扩充中产生了不同的特征。一个关键点是，这些高级数据增强利用了通过聚类提取的类内和类间表示的信息。所提出的方法仅在 min-Imagenet 上显示出显着的性能增益，例如在 miniImageNet 上绝对增益 17.44%，而且还显示了对分布外样本的鲁棒性。此外，图像级和特征级增强和一致性之间的差异如下图所示：

An overview of featMatch augmentation applied on images and features

References

[1]Advanced Data Augmentation Approaches: https://arxiv.org/pdf/2301.02830.pdf

[2]Cutout: https://arxiv.org/abs/1708.04552

[3]Random erasing: https://arxiv.org/abs/1708.04896

[4]Hide-and-Seek: https://arxiv.org/abs/1811.02545

[5]GridMask: https://arxiv.org/abs/2001.04086

[6]Local Augment: https://ieeexplore.ieee.org/document/9319662

你可能感兴趣的:(深度学习,人工智能,数据增强)

Open AI在AI人工智能领域的技术安全防护体系 AI智能探索者 AI Agent 智能体开发实战人工智能安全网络 ai
OpenAI在AI人工智能领域的技术安全防护体系关键词：OpenAI、AI安全、技术防护、伦理框架、模型对齐、数据隐私、对抗攻击摘要：本文将深入探讨OpenAI在人工智能领域构建的多层次技术安全防护体系。我们将从基础概念出发，逐步解析OpenAI如何通过技术创新和系统设计来确保AI系统的安全性、可靠性和可控性。文章将涵盖从数据安全到模型对齐，从伦理框架到实际防护技术的全方位内容，帮助读者全面理解现
揭秘自然语言处理在AI人工智能领域的奥秘 AI智能探索者 AI Agent 智能体开发实战人工智能自然语言处理 easyui ai
揭秘自然语言处理在AI人工智能领域的奥秘关键词：自然语言处理、AI人工智能、语言理解、语言生成、语义分析摘要：本文深入探讨了自然语言处理（NLP）在AI人工智能领域的奥秘。首先介绍了自然语言处理的背景，包括目的、预期读者、文档结构和相关术语。接着阐述了自然语言处理的核心概念与联系，通过文本示意图和Mermaid流程图进行展示。详细讲解了核心算法原理和具体操作步骤，并用Python源代码进行阐述。分
【LangChain编程：从入门到实践】AI 大模型检索增强生成 RAG 实践 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LangChain编程：从入门到实践-AI大模型检索增强生成RAG实践关键词：LangChain,RAG,大语言模型,检索增强生成,向量数据库,嵌入模型,提示工程1.背景介绍在人工智能和自然语言处理领域,大语言模型(LargeLanguageModels,LLMs)的出现无疑是一个重大突破。像GPT-3、GPT-4这样的模型展现出了惊人的语言理解和生成能力,为各种应用场景带来了无限可能。然而,这些
基于深度学习的线上问诊系统设计与实现（Python+Django+MySQL）神经网络15044 深度学习算法神经网络 python 深度学习 django 机器学习人工智能算法目标检测
基于深度学习的线上问诊系统设计与实现（Python+Django+MySQL）一、系统概述本系统结合YOLOv8目标检测和ResNet50图像分类算法，构建了一个智能线上问诊平台。系统支持用户上传医学影像（皮肤照片/X光片），自动分析并生成诊断报告，同时提供医生审核功能。二、技术栈后端框架：Django4.2数据库：MySQL8.0深度学习：YOLOv8：皮肤病变区域检测ResNet50：肺炎X光
深度学习中常见激活函数总结向左转,　向右走ˉ 深度学习人工智能 pytorch python
以下是一份深度学习激活函数的系统总结，涵盖定义、类型、作用、应用及选择影响，便于你快速掌握核心知识：一、激活函数的定义在神经网络中，激活函数（ActivationFunction）是神经元计算输出的非线性变换函数，作用于加权输入和偏置之和：输出=f(加权和+偏置)核心价值：引入非线性，使神经网络能够拟合任意复杂函数（无激活函数的深度网络等价于单层线性模型）。二、常见激活函数类型1.线性函数（Lin
AI离全社会普及，只差一个计算中心？ a13163944010 人工智能
过去十年，人工智能（AI）大爆炸，并第一次走进普通人的生活。但蓬勃发展的AI却碰到一个空前棘手的问题：自2012年以来，AI算力需求6年增长30万倍，远超摩尔定律！人类现有的基础设施，已跟不上AI算力需求的增长。未来，该怎么办？【1】一百多年前，人类也曾面临同样的难题。1866年，德国西门子发明自激发电机，开启了人类的电力时代。此后十几年，虽然很多企业纷纷采用电能这种新的动力，但一台电机只能供应一
首次使用“非英伟达”芯片！OpenAI租用谷歌TPU，降低推理计算成本加百力科技知识财经研究人工智能 chatgpt
OpenAI近期开始租用谷歌TPU芯片，这是该公司首次大规模使用非英伟达芯片。除了OpenAI外、苹果、SafeSuperintelligence和Cohere等公司也一直租用谷歌云的TPU。英伟达的芯片主导地位正被侵蚀，OpenAI租用谷歌TPU，为首次大规模使用“非英伟达”芯片。周六，据媒体报道，作为全球最大的人工智能芯片客户之一，OpenAI近期开始租用谷歌的TPU芯片为ChatGPT等产品
AI人工智能神经网络马里亚纳海沟网人工智能神经网络深度学习笔记运维全文检索搜索引擎
**AI人工智能神经网络概述**神经网络是并行计算设备，它们试图构建大脑的计算机模型。背后的主要目标是开发一个系统来执行各种计算任务比传统系统更快。这些任务包括模式识别和分类，近似，优化和数据聚类什么是人工神经网络(ANN)人工神经网络(ANN)是一个高效的计算系统，其核心主题是借用生物神经网络的类比。人工神经网络也被称为人工神经系统，并行分布式处理系统和连接系统。ANN获取了大量以某种模式相互连
FP16、BF16、INT8、INT4精度模型加载所需显存以及硬件适配的分析 herosunly 大模型精度 BF16 硬件适配
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了FP16、INT8、INT4精度模型加载占用显存大小的分析，希望对学习大
智能办公与科研革命：ChatGPT+DeepSeek大模型在论文撰写、数据分析与AI建模中的实践指南 jwwkyjspt 机器学习 SCI论文人工智能 chatgpt 语言模型机器学习
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
初学Spring AI 笔记笑衬人心。大模型学习 spring 人工智能笔记
目录SpringAI简介依赖与环境配置基础概念集成OpenAI（或其他LLM提供商）Prompt模板引擎Embedding与向量数据库SpringAIChatClient使用SpringAI和LangChain对比常见问题与建议SpringAI简介SpringAI是Spring团队推出的人工智能集成框架，旨在简化AI模型（如OpenAI、HuggingFace、Mistral、AzureOpenA
AI新高度——DEEPSEEK 数字隐士·赛博智者 ai
DeepSeek是由中国人工智能公司「深度求索」开发的一系列高性能大语言模型产品及相关技术体系，其定位为通用人工智能（AGI）探索者，目前已发展成为全球增长最快、性能领先的开源模型之一。下面是关于DeepSeek的详细介绍：一、DeepSeek的开发者与背景‌公司名称‌：杭州深度求索人工智能基础技术研究有限公司（成立于2023年）‌核心支持‌：由中国知名对冲基金「高毅资产」创立并提供资金与技术资源
【机器学习&深度学习】适合微调的模型选型指南一叶千舟深度学习【应用必备常识】深度学习人工智能
目录一、不同规模模型微调适用性二、微调技术类型对显存的影响三、选择建议（根据你的硬件）四、实际模型推荐五、不同模型适合人群六、推荐几个“非常适合微调”的模型七、推荐使用的微调技术八、场景选择示例场景1：智能客服（中文）场景2：法律问答（中文RAG）场景3：医学问答/健康咨询场景4：AI写作助手（中英文）场景5：代码补全/AI编程助手对比总结表九、不同参数模型特点9.1参数规模vs能力9.2微型模型
【机器学习&深度学习】本地部署 vs API调用：关键看显存！一叶千舟深度学习【应用必备常识】深度学习人工智能
目录一、本地部署VSAPI调用1.模型运行方式2.性能与速度3.成本4.隐私与安全5.何时选择哪种方式？二、为什么推荐本地部署？1️⃣零依赖网络和外部服务，更可靠稳定2️⃣无调用次数限制，更适合高频或批量推理3️⃣避免长期API费用，节省成本4️⃣保护用户隐私和数据安全5️⃣可自定义、深度优化6️⃣加载一次即可复用，低延迟高性能7️⃣离线可用（重要！）三、适合本地部署的情况四、本地部署条件4.1模
深度学习 vs 传统机器学习：哪个更适合你的项目？ AI大模型应用之禅深度学习机器学习人工智能 ai
深度学习vs传统机器学习：哪个更适合你的项目？关键词：深度学习、传统机器学习、特征工程、数据量、计算资源、项目选择、算法对比摘要：本文将用"炒菜"和"拼图"等生活案例，从核心原理、适用场景、资源需求等维度对比深度学习与传统机器学习。通过具体代码示例和真实项目场景分析，帮助开发者和企业决策者快速判断：你的项目该选深度学习还是传统机器学习？背景介绍目的和范围随着AI技术普及，"该用深度学习还是传统机器
LLM大语言模型学习笔记（1） Arixs666 大语言模型语言模型笔记人工智能
1.概念大语言模型（LLM，LargeLanguageModel），也称大型语言模型，是一种旨在理解和生成人类语言的人工智能模型。LLM通常指包含数百亿（或更多）参数的语言模型，它们在海量的文本数据上进行训练，从而获得对语言深层次的理解。2.能力2.1涌现能力区分大语言模型（LLM）与以前的预训练语言模型（PLM）最显著的特征之一是它们的涌现能力。涌现能力是一种令人惊讶的能力，它在小型模型中不明显
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？努力毕业的小土博^_^ 机器学习基础算法优质笔记2 深度学习学习笔记迁移学习人工智能机器学习
【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？文章目录【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？✅一、使用正则化进行模型压缩（ModelCompression）目标：方法：L1正则化促使权重稀疏化代码示例：后续压缩步骤
数字孪生：未来城市管理的革命性技术大有数据可视化信息可视化
一、数字孪生技术概述数字孪生技术是一种通过创建虚拟模型与物理实体之间实时交互的技术。它借助物联网、大数据、云计算、人工智能等前沿技术，实现对物理实体的精准映射与动态仿真。数字孪生的核心在于构建一个与物理世界相对应的虚拟模型，该模型能够实时反映物理实体的状态，并通过数据分析与模拟优化其性能。在城市管理领域，数字孪生技术为城市管理者提供了一种全新的视角和工具。城市是一个复杂的巨系统，涉及基础设施、交通
人类编程时代即将终结？OpenAI首席产品官预测AI将在今年底全面超越人类程序员前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读近日，OpenAI首席产品官KevinWeil在接受采访时表示，人工智能的发展速度远超预期，今年底就有可能在编程领域永久性地超越人类程序员。这一观点立即引发了行业热议，也让程序员们对未来产生了深刻的思考。人工智能的进展速度远超想象在与VarunMayya和TanmayBhat共同主持的YouTube节目《O
Python大数据分析&人工智能教程 - Django-Celery异步处理（深入解析与实战案例） AI_DL_CODE python 数据分析 Django Celery异步处理 Celery
文章目录1.概念介绍1.1Django框架概述1.2Celery异步任务队列1.3AMQP协议与消息路由2.环境搭建2.1安装Django和Celery2.2配置Redis作为消息代理3.Celery架构与工作原理3.1Celery组件介绍3.2任务生命周期3.3任务调度与执行3.3.1定时任务3.3.2异步任务调用3.3.3任务结果查询4.Django与Celery集成4.1创建Celery实例
智能之火，重塑创造：大模型如何点燃新一代开发引擎？黑巧克力可减脂 AIGC 人工智能 AIGC
导言：普罗米修斯之火再现在科技演进的长河中，每一次生产力的跃迁都伴随着工具的质变。从蒸汽机轰鸣到电力普及，再到信息高速公路的铺就，人类驾驭能量的能力不断突破。今天，我们站在一个崭新的临界点上：大语言模型（LLM）正将人工智能的“普罗米修斯之火”引入软件开发的核心腹地。这不再仅仅是效率的优化，更是对开发者角色、开发流程乃至软件本质的深度重塑。GitHubCEOThomasDohmke曾断言：“Cop
Python大数据分析&人工智能教程 - Django-RestFramework框架（深入解析+实操案例） AI_DL_CODE python 数据分析 django RestFramework框架
文章目录1.Django-RestFramework基础1.1Django-RestFramework概述1.2安装与配置1.3构建第一个API1.3.1定义模型1.3.2创建序列化器1.3.3定义视图1.3.4配置URL路由1.4进阶功能1.4.1权限控制1.4.2限流1.5实战案例1.5.1创建图书1.5.2查询图书1.5.3更新图书1.5.4删除图书2.序列化器(Serializers)2.
Python从0到100完整学习指南（必看导航）是Dream呀 Python python 人工智能爬虫 web 神经网络算法深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和工作就业的先行者！【优惠信息】•新专栏订阅前1000名享9.9元优惠•订阅量破10
【机器学习&深度学习】模型微调的基本概念与流程一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、什么是模型微调（Fine-tuning）？二、预训练vs微调：什么关系？三、微调的基本流程（以BERT为例）1️⃣准备数据2️⃣加载预训练模型和分词器3️⃣数据编码与加载4️⃣定义优化器5️⃣开始训练6️⃣评估与保存模型四、是否要冻结BERT层？五、完整训练示例代码5.1环境依赖5.2执行代码总结：微调的优势前言在自然语言处理（NLP）快速发展的今天，预训练模型如BERT成为了众多任务
FastGPT与MCP：解锁AI新时代的技术密码挑战者666888 AI模型应用实战迁移学习集成学习文心一言
一、AI浪潮中的新星：FastGPT与MCP登场在当今科技飞速发展的时代，人工智能（AI）已成为推动各行业变革的核心力量。从智能语音助手到复杂的图像识别系统，AI的应用无处不在，而其中的关键技术——语言模型和集成平台，更是备受关注。FastGPT和MCP（Multi-ComponentPlatform）作为这一领域的新兴代表，正逐渐崭露头角，为AI的发展注入新的活力。FastGPT，以其高效的推理
前沿技术推动机器人的智能化升级 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据机器人 ai
前沿技术推动机器人的智能化升级关键词：机器人智能化、人工智能、机器学习、计算机视觉、自主导航、人机交互、边缘计算摘要：本文深入探讨了前沿技术如何推动机器人从传统自动化向智能化升级的演进过程。文章首先分析了机器人技术发展的历史脉络和当前挑战，然后详细阐述了人工智能、机器学习、计算机视觉等关键技术如何赋能机器人智能化。通过算法原理分析、数学模型构建和实际项目案例，展示了智能机器人的核心技术实现路径。最
linux深度学习问题汇总不想改代码备忘录 linux python 深度学习 pytorch 人工智能 1024程序员节
目录一、异常问题1.segementationfault(coredump)2.Illegalinstruction(coredumped)3.死锁4.掉卡二、通用方法1.查看重启记录2.系统性能监控3.后台执行命令4.异常日志三、深度学习技术1.普通网络改DDP训练，单机多卡，pytorch四、专业内容方法1.微调diffusion类模型本文记录一些在使用linux服务器进行深度学习时遇到的问题
提升首屏加载的秘密武器：一文讲透 CDN 加速核心逻辑网罗开发实战源码前端 json javascript
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d