songlixiangaibin

深度学习中图像增强技术的综合综述

前言

2022CVPR论文阅读
A Comprehensive Survey of Image Augmentation Techniques for Deep Learning

深度学习中图像增强技术的综合综述
Abstract
深度学习在需要大量图像的计算机视觉中已经取得了良好的性能，然而，在许多场景下，收集图像是昂贵和困难的。为了缓解这一问题，许多图像增强算法被提出作为有效的策略。理解当前的算法对于找到合适的方法或为给定的任务开发新的技术是至关重要的。在本文中，我们用一种新的信息分类法对深度学习的图像增强进行了全面的调查。为了基本了解我们为什么需要增强的图像，我们介绍了计算机视觉任务和附近分布中的挑战。然后，将算法分为三类；无模型、基于模型和基于优化策略。无模型类别采用图像处理方法，而基于模型的方法利用可训练的图像生成模型，相比之下，基于策略的优化方法旨在找到最优操作或其组合。此外，我们还讨论了当前具有两个更活跃主题的常见应用的趋势，利用不同的方法来理解图像增强，如群理论和核理论，以及部署图像增强进行无监督学习。在此基础上，我们认为我们的调查可以更好地理解，有助于选择合适的方法或设计新的算法的实际应用。

Introduction
近年来，深度学习在计算机视觉方面取得了显著的进步，即高效的计算设备、强大的算法和大量的图像。过去十年的一项主要工作是设计一个强大的具有大量可训练参数1的模型，需要大量的图像来训练模型具有具有竞争力的性能。然而，在很多情况下，收集图像是非常昂贵和困难的。因此，在有限数量的图像下获得类似的性能是一个问题，特别是在实际应用中，如医疗[1]和农业图像[2]。
为了缓解这一问题，图像增强被认为是有效和有效的策略，以前的工作批准了它的[3,4]。如表1所示，大量的图像增强方法被用于图像分类和目标检测。因此，理解所提出的图像增强方法是有意义的，这可以帮助我们部署合适的算法。虽然[5,6,7]也存在一些类似的调查论文，但由于几个原因，我们的论文有本质上的不同。首先，我们不将自己局限于特定类型的图像，如人脸图像[8]。其次，包含了许多类型的图像增强算法，而不是特定类型的，如只包含生成对抗网络[9]和图像混合[10]。第三，我们不关注一个特定的应用程序，如目标检测[5]。相反，图像分类和目标检测是两个主要的应用，但与其他图像或视频的应用一样，如分割和跟踪。最后，与[6][7]的两个相关工作相比，本调查介绍了最近有效的图像增强算法，如实例级多图像混合和基于模型的方法的更全面的分析。因此，我们的调查论文涵盖了更广泛的算法，其中我们引入了一个新的信息分类。
特别地，我们首先解释了为什么不同的图像增强算法在不同的应用程序中被设计和利用的原因。更具体地说，我们引入了计算机视觉和附近分布方面的挑战，以理解图像增强的必要性。通过增强图像，可以减轻挑战，并可以扩大附近的分布空间，从而提高了训练模型的广义能力。在此基础上，我们认为，如果提出新的挑战，提出新的图像增强是令人鼓舞的。同时，一旦在一个应用程序中观察到一个挑战，我们就可以使用相应的方法来减轻它。
综上所述，我们的论文有以下贡献：
• 我们引入了挑战和邻近分布，以更好地理解在基于深度学习的计算机视觉任务中执行图像增强的必要性。
• 我们提出了一个全面的调查图像增强与一个新的信息分类，包括更广泛的算法。
• 我们讨论了当前常见应用的趋势，有两个更活跃的主题，利用不同的方法来理解图像增强，如组和核理论，并部署图像增强的无监督学习。

表1：在那些涉及图像分类和目标检测的论文中所使用的图像增强算法。

本文的组织结构如下。第二部分首先介绍了研究分类法。然后，我们在第三部分展示了做图像增强的两个基本动机，计算机视觉任务的挑战和附近分布。第四部分介绍无模型图像增强，第五节讨论基于模型的方法。在第六部分中介绍了在许多图像增强算法中寻找最优算法，然后是一个讨论部分。最后，我们在最后一节中总结了我们的论文。

图1：本文中的图像增强的分类法。
2. Taxonomy
如图1所示，我们将图像增强算法主要分为三大类。无模型首先不利用预先训练好的模型来进行图像增强，并由单图像和多图像组成。其次，基于模型的图像增强算法需要用一个经过训练的模型来生成图像。根据生成新图像的条件，可以分为无条件、标签条件和图像条件。最后，从许多具有大参数空间的可能算法中寻找具有合适参数的最优操作的算法被称为基于策略的优化算法。基于学习策略，可分为强化学习和对抗性学习。基于强化学习的算法利用一个巨大的搜索空间，包括不同的操作及其大小，以及一个代理，在给定的搜索空间中找到最优策略。相比之下，基于对抗性学习的方法的目的是找到相应规模的算法，使任务模型有很大的损失。

表2：从数据集和深度学习模型的角度看计算机视觉任务的挑战。
3. Motivation to perform image augmentation
3.1. Challenges
表2描述了计算机视觉任务的四种挑战。第一个是物体在不同情况下的图像变化，包括照明、变形等。图2说明了部分图像的变化2。类不平衡是另一个挑战，即某些对象比其他对象更容易被观察到。以医学图像为例，异常病例发生的概率较低，隐私性是另一个问题。用不平衡数据集训练，模型往往给正常情况更大的概率。此外，域移也导致了训练数据集和测试数据集分布不同的问题。其中一个例子是与自动驾驶相关的昼夜域。由于在白天收集图像更方便，我们希望用白天的数据集来训练我们的模型，但在夜间进行评估。

图2：来自类CS231n的图像变化的示例。
除了来自数据集的挑战外，深度学习时代的一个新挑战是数据记忆。一般来说，更可学习的参数需要更多的数据来训练模型，称为结构风险。由于比经典算法使用了更多的参数，一个简单的解决方案是在训练图像数量较少的深度学习中只记住所有的数据点，这就引入了泛化问题或过拟合。
幸运的是，图像增强方法可以通过增加训练数据集中图像数量及其图像的变化来缓解挑战，提高泛化能力。为了有效地利用图像增强算法，最好了解我们应用的挑战，然后应用合适的方法。本文旨在调查了解广泛的图像增强算法。
3.2. Vicinity distribution
在监督学习范式中，我们期望找到一个函数f∈F，它反映了联合分布P(x，y)中的输入x和目标y之间的关系。为了学习f，对于Pf(x)中的所有例子(x，y)，定义了一个损失l来减少预测f(x)和实际目标y之间的差异。然后，如果我们可以在P(x，y)上减少l，我们就可以优化f，这被称为预期风险[23]，可以表述为：R(f)=Rl(f(x)，y)dP(x，y)。但在大多数应用程序中，P(x，y)是未知的[25]。或者，我们利用经验分布Pe(xy)来近似P(xy)。在这种情况下，将观察到的数据集D=(xi，yi)ni=1作为经验分布，其中(xi，yi)在给定i的Pe(x，y)中：

其中，δ(x，y)是一个以该点(xi，yi)为中心的Dirac质量函数，假设概率分布中的所有质量都聚集在一个单点[26]周围。近似P(x，y)的另一种自然思想是附近分布Pv(x，y)，它用点(xi，yi)附近的密度的估计来代替Dirac质量函数：

式中，δv为d中(xi，yi)的附近点集。附近分布假设P(x，y)在任意点(xi，yi)[25]附近是光滑的。在Pv(x，y)中，模型很难记住所有的数据点，因此在测试过程中往往具有更好的性能。实现附近分布的一种方法是应用图像增强，使原始数据点(xi，yi)可以在其附近移动一点。例如，高斯附近分布被声明为与在图像中添加高斯噪声相同。
4. Model-free image augmentation
图像处理方法可以用于图像增强，如几何变换，这通常被称为图像处理[6,7]。在本文中，我们将其称为无模型图像增强，以与基于模型的图像增强有明显的对比度。无模型由两个分支组成，单图像和多图像。如名称所示，单个图像从单一图像中产生增强图像，但多重图像从多个图像中产生输出。
4.1. Single-image augmentation
从附近分布来看，单图像增强(SiA)的目的是波动训练数据集中的数据点，使分布更加密集。一般来说，SiA利用了传统的图像处理，易于理解和执行。它可以分为几何变换、彩色图像处理和强度变换。
4.1.1. Geometric transformation
在自然捕获的图像中的物体可以出现在许多变化中，几何变换可以用来增加变化。首先，平移给出了增加物体位置变化的机会。第二，可以旋转一个图像，然后可以改变对象的视点。旋转值应小心，否则，对象可能不会进行标签保存。第三，可以根据训练和测试数据集的特点进行水平或垂直翻转。例如，城市景观[28]数据集可以水平地增强，但可能不能以垂直的方式增强。第四，物体可以通过缩放来放大或缩小来模拟多尺度的变化。最后，弹性扭曲可以改变物体的形状或姿势。其中，作物和翻转在过去十年的许多工作中被常用，用于各种计算机视觉任务，如图像分类[11,12,13]、目标检测[29,30]、图像转换[31,32]。当使用这些方法时，应该注意两件事，即保存标签标识的操作的大小和数据集中的高效变化。
4.1.2. Color image processing

表3：使用强度变换的论文。如果有的话，我们突出显示相应的数字。
与灰度图像不同，彩色图像由三个通道组成。使用彩色图像处理作为图像增强的假设是，训练和测试数据集的分布随颜色而波动，如对比度。虽然彩色图像处理显示出了优越性，但最近似乎被放弃了，主要是因为训练和测试数据集之间的颜色变化很小。但一个有趣的点是通过彩色图像处理，任务不可知的学习来学习对比度学习[33]的鲁棒特征。
4.1.3. Intensity transformation
强度变换的目的是改变像素级或补丁级的像素值。相比之下，几何变换和彩色图像处理是在图像级上执行的。随机噪声是最简单的算法之一，如高斯噪声[23]。经典的方法在像素级上独立地利用随机噪声，但最近补丁级变得流行起来，并在深度学习算法[34]、[35]、[36]、[37]方面显示出了不错的改进。论文内容见表3。其背后的基本思想是，阻塞最重要区域的部分会推动模型学习健壮的特征，因为其中一个简单的解决方案只是记住最重要的部分[24]。
Cutout[35]随机掩盖了最重要的部分，并发现了一种模拟咬合的机制。然而，找到重要的部分是成本。隐找[34]直接屏蔽图像的一部分，认为重要部分在多次利用随机过程时可能被掩盖，简单快速。具体来说，图像被分为如图3所示的s×patches，每个patches被随机阻塞, 它的缺点之一是相同大小的patches，导致相同级别的遮挡。为了解决这个问题，提出了具有三个随机值的随机擦除[36]，即要被阻塞的大小，高度和宽度的比值，以及区域的左向上点。图4给出了三个计算机视觉任务的随机擦除的一些例子。此外，该方法可以用于图像感知和对象感知，如©所示，这可以简化目标检测。
除了删除之外，GridMask旨在平衡删除和保留，因为我们想阻止一个对象的一些重要部分，但保留该对象的一部分，以模拟真实的遮挡。为了实现这一点，网格掩模引入了一组预定义的掩模，而不是[34,35,36]中的一个掩模。如图5所示，生成的掩模来自四个值，其中两个表示每个网格的宽度和高度，另外两个表示相邻网格掩模在垂直和水平上的距离。通过改变这四个值，可以实现不同大小和不同距离的网格掩模。在这种情况下，网格掩模在删除和保留之间取得了更好的平衡，初步实验表明，与删除[35]和隐藏相比，它产生失败情况的几率更低。

图4：来自随机擦除的示例
4.2. Multiple-image augmentation
多图像增强(MiA)算法在多个图像上执行，可分为实例级和非实例级两类。由于一个图像可以包含多个实例，因此我们可以屏蔽实例，然后独立地使用它们。与SiA相比，MiA要求算法合并多个输入实例。
4.2.1. Non-instance level
首先，非实例级采用和融合图像。相关论文列表见表4。最简单的方法之一是计算每个像素的平均值。在配对样本[39]中，两个图像被融合，从一个源图像中产生一个带有标签的增强图像。该假设在Mixup[38]中被推广，其中标签也被融合。图6显示了配对样本和混合样本之间的差异。数学上，˜x=λxi+（1−λ）xj和˜y=λyi+（1−λ）yj，其中xi和xj是两个图像，yi和yj是对应的一个热标签。˜x和˜y是生成的图像和标签。通过更改0≤λ≤1，可以创建许多具有不同标签的图像，并且在增强的图像中，两个标签之间的间隙变得平滑。虽然分割样本和混合取得了更好的结果，但融合的图像对人类来说是不合理的。为了理解这个问题，从波形[40]的角度来看，融合的图像对机器有意义。

表4：多图像增强相关论文。

图6：非实例级多图像算法的比较
与[40]不同，CutMix[41]在空间上合并图像，为人类制作合理的图像。图6中的最后一幅图片展示了它的策略，即合并后的图像在空间上由两个源图像组成，其标签来自于两个图像的一些像素的比例。一般来说，多图像增强利用两个图像，但也允许两个以上的图像。例如，Mosaic[22]使用了四张图像，从而增加了一张图像中的对象数量，从而显著减少了对大批量进行密集预测的需求。此外，AugMix[42]随机应用多种基本图像增强，并将结果与原始图像进行合并
非实例级图像增强与强度变换具有类似的扩展。为了使用最重要的部分，PuzzleMix[43]区分了前景和背景，并混合了重要的前景。为了更快地找到主导区域，超混合[44]开发了牛顿迭代方法的一种变体。就像隐藏和看到[34]一样，GridMix[45]将图像划分为网格，然后从两个输入图像的相应补丁中随机抽取输出图像的每个补丁。通过分析，我们认为网格面具[51]可以适用于混合两幅图像。
4.2.2. Instance level
非实例级直接使用图像，而实例级则利用被图像掩盖的实例。相关论文见表4的第二部分。在形式上，实例级别包括两个主要步骤。如图7所示，第一步是根据语义掩码从源图像中切割对象实例，并获得干净的背景感知。接下来，将获得的实例或多个实例和背景进行合并。剪切、粘贴和学习[46]是最早的作品之一，即注意到将实例粘贴到后台后的本地工件。由于基于局部区域的特征对目标检测很重要，因此采用了各种混合模式来减少局部伪影。除了边界之外，实例的规模和放置实例的位置并不简单，因为一个对象可以在多尺度上，可以通过上下文来识别，这在[47]中提到。
有趣的是，实例级的图像增强可以缓解类不平衡的挑战。通过重用这些罕见的实例，就增加了相应类的图像数量。简单的复制粘贴[49]声明实例级是一种强大的实例分割图像增强方法。尽管基于复制，粘贴和学习，简单的复制粘贴在两个方面有所不同。首先，从数据集中随机选择背景图像，并应用随机尺度抖动和水平翻转。其次，利用大规模的抖动来获得更显著的性能。复制粘贴的想法也被用于时间序列任务[50]，如跟踪。

Model-based image augmentation
本文需要对基于模型的图像增强模型进行预训练，根据图像生成条件分为无条件、标签条件和图像条件三类。表5给出了相关论文的信息。
5.1. Unconditional image generation
图像合成模型有利于图像增强，因为它可以产生原始数据集中不存在的新图像。理论上，训练[68]后，生成的图像的分布与GANs模型中的原始数据集相似。但生成的图像与原始图像并不相同，可以作为位于附近分布中的点进行拍摄。在DCGAN[69]中，可以插值两个随机噪声或潜在向量来生成中间图像，这可以看作是两个原始数据点之间的波动。通常将以噪声为输入的生成模型视为无条件模型，将图像生成过程作为无条件图像生成。如果数据集中只有一个类，如具有一个异常类[70]的医学图像，则可以直接使用一个无条件的图像生成模型来进行图像增强。此外，如果有多个类[71]，[72]，则可以利用一个特定的无条件模型。

图8：GAN和标签条件GAN[52]的变体。 G: 生成器，A：认证器，C：分类器，D：鉴别器。

5.2. Label-conditional image generation
虽然无条件的图像生成显示了其潜力，但不同类的共享信息不能被利用。相比之下，标签条件图像生成有望利用共享信息，学习少数图像和更多图像的多数类的变化。标签条件图像生成要求一个特定的标签作为额外的输入，生成的图像应该与标签条件对齐。
标签条件图像生成的第一个问题是如何使用标签条件。CGAN[73]使用生成器的标签，但身份验证器不使用该标签。因此，生成器倾向于忽略标签信息，因为身份验证器不能提供关于该条件的反馈。ACGAN[74]在鉴别器中引入了一个辅助分类器，它鼓励生成器生成与标签条件对齐的图像。对于更复杂的分类器，BDA[52]将分类器从鉴别器中分离出来。图8说明了BDA和其他方法之间的区别。此外，MFC-GAN[55]在分类损失中采用了多个假类，以提高训练的稳定性。

图9：dagan[57]的流程图，其中的标签信息是通过一个编码器来自一个图像，而不是一个标签。
标签条件图像生成的主要应用之一是针对类不平衡[55][53][56]。生成模型被期望从大多数类中学习有用的特征，并使用它们来生成微型类的图像。生成的图像可以用于重新平衡原始的训练数据集。然而，用类不平衡数据集训练GAN模型并不容易，因为多数类主导了鉴别器的损失，而生成器倾向于从多数类产生图像。为了解决这一挑战，我们借用了一个具有重构损失的预训练自动编码器来初始化生成器[54][56]。
虽然采用了不同的鉴别器或分类器，但上述算法利用了一个热标签中的类条件。其中一个限制是，训练后的模型只能生成已知类的图像。为了减轻这一限制，dagan[57]利用一个图像编码器来提取类，如图9所示，其中生成的图像应该与图像具有相同的类。
5.3. Image-conditional image generation
除标签外，图像也可以作为条件应用，称为图像转换。通常，一个图像由内容和样式[75,76]组成。内容是指类依赖的，如狗和猫，但风格表示类独立的，如颜色和照明。图像条件图像的生成可以分为两种类型，标签保留和标签改变。前者要求保留内容，而后者则要求更改内容。
5.4. Label-preserving
标签保留假设生成的图像的标签与输入的图像相同。要部署它的一个活动字段是域转移，其中源域的样式与目标域的样式不同。为了解决这个挑战，我们可以将原始图像从源域转换到目标域。为了在图像转换过程中保持对象，利用提取上下文感知特征的分割模块与AugGAN[58]中的生成器共享参数。在实际应用中，将通过图形模型合成的图像转化为自然图像[59]，将叶片布局转化为真实的叶片图像[60]。此外，图像翻译也可以用于具有域移位[77]的语义分割。除了域位移外，还可以利用标签保留来提高训练模型的鲁棒性。根据CNN对纹理的偏好，原始图像被翻译成不同的纹理，这使得CNN更多地关注形状[62]。
在图像生成过程中，如何获得所需的样式是一个问题，大多数算法利用编码器从图像中提取样式，如DRIT++[78]和spade[79]。这种图像平移可以看作是图像的混合。相反，Jackson等人[61]提出了风格增强，其中风格来自多元正态分布。此外，另一个挑战是是否可以采用一个模型来用训练较少的图像生成多个领域的图像。为了解决这个问题，在MetalGAN[80]中利用了领域损失和金属学习策略。
5.3.2. Label-changing
与保留标签相比，标签的改变需要改变标签的依赖性。例如，中性的脸被转化为不同的情绪[63]。虽然生成的图像保真度较差，但它们确实提高了情绪分类。除了改变标签依赖外，保留标签独立最近得到了关注，因为保留的标签独立可以从源类引入到目标类中，从而改进目标类的变化，这有助于类的不平衡。为了利用大多数变异，Xu等人的[2]利用一种花柱损失来缓解番茄叶片图像的疾病识别的类别不平衡。此外，为了获得语义上的一致性，如对象的数量，Zheng等[67]引入了一个通道较少的多分支鉴别器，获得了良好的图像翻译，如图10所示。为了解决严重的类不平衡，例如一个标签只有几个图像，提出了一种增量编码器，将标签独立的特征从一个标签提取到另一个标签[64]。与dagan[57]相似，类信息由一个图像给出。增量编码器和解码器的目标是在训练阶段重建给定的图像x，而解码器得到一个新的标签图像，并期望在测试阶段生成相同的标签。
与保留标签法相比，改变标签法对于通过同时改变标签和风格来提高模型的鲁棒性更令人印象深刻。如图11所示，传统的图像增强技术在将黑猩猩的颜色改为柠檬后不会改变标签，这导致了一个形状偏差模型。相比之下，如果翻译后的图像被标记为柠檬，则训练纹理偏置模型。为了平衡这种偏差，通过风格转换的翻译图像使用了两个标签[65]，包括黑猩猩和柠檬，这导致了一个去偏模型。此外，受Mixup[38]的启发，Hong等人提出了StyleMix[66]，其中合并两个输入将分别导致内容和样式标签，如图12所示。最后，将内容和样式标签融合为生成的图像的最终标签。

图10：MBD[67]对标签改变的图像增强进行语义级匹配，包括位置、数字和姿态。

图11：关于形状和纹理的有偏和无偏模型的标签分配
6. Optimizing Policy-based image augmentation
最后两节中提到的算法都是具体的方案，如随机裁剪和混合两幅图像，其中需要领域知识才能有更好的性能。一般来说，利用期望大小的单个操作，根据特定数据集的特征进行图像增强。但是找到合适的超参数并不容易和耗时。解决这个挑战的一个想法是设计算法来找到最优的增强策略。这些算法被称为基于优化策略，包括基于强化学习和基于对抗性学习两类。前者采用强化学习来寻找最优策略。相反，后者利用这些增强操作及其规模，导致巨大的训练损失或小的验证损失。相关论文列于表6。

图12：使用不同算法的标签分配示例
6.1. Reinforcement learning-based image augmentation
自动增强[81]是利用强化学习的开创性工作。如图13所示，它由找到最佳策略的迭代步骤组成。控制器从具有操作类型及其对应概率和幅度的搜索空间中采样策略，利用任务网络获得验证精度作为反馈来更新控制器。由于搜索空间非常大，更轻的子网络被利用。经过训练后，借用控制器对原始任务模型进行训练，并可在其他数据集中进行微调。
自动增强在几个数据集中取得了良好的分类性能，但花费了较长的训练时间。为了解决这个问题，有几篇来自不同观点的论文。首先，随机[82]用均匀概率替换自动增强中的几个概率。其次，FastAA[83]和FaserAA[85]利用密度匹配，对齐训练数据集和增强训练数据集的密度，而不是近端策略优化[95]来自动优化控制器。第三，PBA[84]的目标是学习一个受基于人口的培训启发的政策时间表，而不是一个单一的政策。

图13：自动增强[81]的概述，一种基于强化学习的图像增强。
除了训练时间外，自动增强还利用了子模型，通过这些子模型，学习到的策略可能不是最终任务模型的最佳策略。为了解决这个问题，Hataya等人的[86]通过快速AA中相同的可微图像增强管道同时训练目标模型和图像增强策略。不同的是，对抗性的AA[91]利用了对抗性的损失和强化学习。
上述算法的一个局限性是，学习到的图像增强策略处于数据集级别。相比之下，在[96]和[87]中分别考虑了类级和样本级的图像增强，其中每个类或每个样本都使用了一个特定的策略。此外，在[88]中讨论了一种用于目标检测的实例级图像增强方法，其中的操作只在边界框内进行。
6.2. Adversarial Learning-based image augmentation
图像增强的主要目标是用一个训练数据集来训练一个任务模型，使其在测试数据集中具有良好的泛化能力。一种假设是，硬样本更有用，而那些使模型具有更大训练损失的输入图像被认为是硬样本。基于对抗性学习的图像增强算法的目的是学习一种图像增强策略，根据原始训练样本生成硬样本。
早期的工作[89]试图找到一个小的变换，在增强样本上产生最大的训练损失，其中学习优化是找到一个给定一个操作的最优幅度。此外，其中一个主要的限制是标签保留假设，即增强图像保留与原始图像相同的标签。为了满足这一假设，一种常见的策略是利用人类知识设计操作类型和相应规模的范围。为了削弱这一假设，Ratner等人[90]引入生成对抗损失来学习转换序列，在该序列中，鉴别器将生成的图像作为原始类，而不是一个看不见的或空类。
有趣的是，SPA[93]试图选择合适的样本，其中图像增强仅针对那些增强图像比原始图像造成更大训练损失的样本。虽然SPA在样本水平上同时训练图像增强策略和任务模型，但学习到的策略在验证数据集中的影响是未知的。为了解决这一挑战，采用了一个影响函数来提供验证损失变化的近似，而不实际比较性能[92]。另一个有趣的想法是在测试阶段使用图像增强技术。为了实现这一想法，ada转换[94]学习了两个任务，竞争任务和合作任务，如图14所示。
在竞争任务中，变压器通过增加目标网络的损失来学习扩大输入方差，而鉴别器的目标是推动增强后的图像真实。相比之下，变压器通过减少目标网络的损失来学习减少合作任务中增强图像的方差。经过训练后，利用变压器来减少输入图像的方差，从而使测试过程更容易。

图14：ada转换[94]的概述。它由竞争训练和合作测试两个任务，以及变压器T、鉴别器D和目标网络N三个组件组成。变压器通过与D和N同时竞争来增加训练数据的方差。它还与N合作进行测试，以减少数据的方差。
7. Discussions
当前趋势。这个数据集对于获得良好的性能至关重要。制作一个像样的数据集的一种方法是应用图像增强算法，一个重的算法被证明是令人印象深刻的。无模式和优化策略在计算机视觉的大多数应用中得到广泛应用，而基于模式是阶级不平衡和领域适应。此外，大多数算法保持标签保留，但标签改变算法近年来受到了关注。虽然有许多图像增强算法，但设想新的算法是有意义的。我们认为，识别新的挑战可以激发一种新的方法，如果挑战可以模仿使用图像增强。
了解图像增强功能。在本文中，我们试图从挑战和附近分布的角度来理解执行图像增强算法进行深度学习的原因。并验证了图像增强与正则化[27]相似。近年来，人们利用核理论[97]和群理论[98]来分析图像增强的影响。此外，利用亲和和多样性[99]量化图像增强如何提高模型泛化。另外，在[100]中分析了图像增强计划如何影响优化并与优化超参数如学习率和批大小进行交互。
使用图像增强的新策略。图像增强通常以有监督的方式使用，但也可以使用不同的方式。首先，通过图像增强来创建借口任务，如预测旋转度[101]，图像补丁[102]的相对位置。其次，只要假设增强图像与原始图像[103,104,105]相似，就可以利用它来生成对比度学习的积极例子。此外，半监督学习也受益于图像增强[27,106,107]。
8. Conclusion
在本文中，我们调查了广泛的图像增强算法与一个新的分类，包括三个部分，无模型，基于模型，和优化策略。为了理解执行图像增强的原因，我们分析了在计算机视觉任务中部署深度学习模型的挑战，并借用了附近分布的概念。我们发现，图像增强显著提高了任务性能，许多算法都是针对特定的挑战而设计的，如遮挡的强度转换和基于模型的类不平衡和域偏移的算法。在此基础上，我们认为新的方法可以激发新的挑战，同时，我们可以在认识到数据集中的挑战后，选择相应的方法。我们希望我们的论文能更好地理解图像增强算法，并鼓励社区更多地关注数据集。
Acknowledgment
本研究部分由韩国基础科学研究计划通过韩国国家研究基金(NRF)由教育部(没有。2019R1A6A1A09031717)，由韩国国家研究基金会(NRF)资助的科学和ICT(MSIT)(没有。2020R1A2C2013060)，并支持韩国规划和评估技术研究所食品、农业和林业(IPET)和韩国智能农场研发基金会(KosFarm)通过智能农业创新技术发展计划，由农业、食品和农村事务部(MAFRA)和科学和ICT(MSIT)，农村发展管理局(RDA)（没有421027-04）。
References

你可能感兴趣的:(深度学习,计算机视觉,人工智能)

【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
网络安全相关专业总结（非常详细）零基础入门到精通，收藏这一篇就够了网络安全工程师教学兼职副业黑客技术网络安全 web安全安全人工智能网络运维
一、网络工程专业专业内涵网络工程是指按计划进行的以工程化的思想、方式、方法，设计、研发和解决网络系统问题的工程，一般指计算机网络系统的开发与构建。该专业培养具备计算机科学与技术学科理论基础，掌握网络技术领域专业知识和基本技能，在计算机、网络及人工智能领域的工程实践和应用方面受到良好训练，具有深厚通信背景、可持续发展、能力较强的高水平工程技术人才。学生可在计算机软硬件系统、互联网、移动互联网及新一代
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
《北京市加快推动“人工智能+医药健康“创新发展行动计划（2025-2027年）》深度解读
引言随着新一轮科技革命和产业变革的深入推进，人工智能技术与医药健康的深度融合已成为全球科技创新的重要方向。北京市于2025年7月正式发布《北京市加快推动"人工智能+医药健康"创新发展行动计划（2025-2027年）》，旨在充分发挥北京在人工智能技术策源、头部医疗资源汇聚、健康数据高度富集等方面的突出优势，构建形成"人工智能+医药健康"创新和应用并举的产业生态体系，打造具有国际影响力的创新策源地、应
「源力觉醒创作者计划」_文心大模型开源：开启 AI 新时代的大门小黄编程快乐屋人工智能
在人工智能的浩瀚星空中，大模型技术宛如一颗璀璨的巨星，照亮了无数行业前行的道路。自诞生以来，大模型凭借其强大的语言理解与生成能力，引发了全球范围内的技术变革与创新浪潮。百度宣布于6月30日开源文心大模型4.5系列，这一消息如同一颗重磅炸弹，在AI领域掀起了惊涛骇浪，其影响之深远，意义之重大，足以改写行业的发展轨迹。百度这次放大招，直接把文心大模型4.5开源了，这操作就像往国内AI圈子里空投了一个超
四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
AI智能体原理及实践：从概念到落地的全链路解析 you的日常人工智能大语言模型人工智能机器学习深度学习神经网络自然语言处理
AI智能体正从实验室走向现实世界，成为连接人类与数字世界的桥梁。它代表了人工智能技术从"知"到"行"的质变，是能自主感知环境、制定决策、执行任务并持续学习的软件系统。在2025年，AI智能体已渗透到智能家居、企业服务、医疗健康、教育和内容创作等领域，展现出强大的生产力与创造力。然而，其发展也伴随着技术挑战、伦理困境和安全风险，需要从架构设计到落地应用的全链条思考与平衡。一、AI智能体的核心定义与技
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
YOLO学习笔记｜从YOLOv5到YOLOv11：技术演进与核心改进北斗猿 YOLO学习从零到1 YOLO 目标检测算法 python 计算机视觉
从YOLOv5到YOLOv11：技术演进与核心改进深度解析一、YOLO系列发展概述YOLO（YouOnlyLookOnce）目标检测算法自2016年诞生以来，凭借其"单次检测"的独特理念和卓越的实时性能，持续引领着计算机视觉领域的技术革新。从JosephRedmon的初代YOLO到AlexeyBochkovskiy的YOLOv4，再到Ultralytics团队的YOLOv5及后续系列，这一算法家族
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
Spring AI 第二讲之 Chat Model API 第八节ZhiPu AI Chat 疼死老夫了人工智能
SpringAI支持知普人工智能的各种人工智能语言模型。您可以与知普人工智能语言模型互动，并基于知普人工智能模型创建多语言对话助手。先决条件您需要与ZhiPuAI创建一个API，以访问ZhiPuAI语言模型。在ZhiPuAI注册页面创建账户，并在APIKeys页面生成令牌。SpringAI项目定义了一个名为spring.ai.zhipuai.api-key的配置属性，你应将其设置为从APIKeys
Chat Model API 虾条_花吹雪 Spring AI java
聊天模型API为开发人员提供了将人工智能聊天完成功能集成到应用程序中的能力。它利用预训练的语言模型，如GPT（生成预训练转换器），以自然语言对用户输入生成类似人类的响应。API通常通过向人工智能模型发送提示或部分对话来工作，然后人工智能模型根据其训练数据和对自然语言模式的理解生成对话的完成或继续。然后将完成的响应返回给应用程序，应用程序可以将其呈现给用户或用于进一步处理。Spring人工智能聊天模
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！中杯可乐多加冰前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
深度学习实验：GPU加速，突破性能瓶颈 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
深度学习实验：GPU加速，突破性能瓶颈1.背景介绍随着深度学习模型变得越来越复杂和庞大，传统的CPU已经无法满足训练和推理的计算需求。GPU凭借其强大的并行计算能力和专门为矩阵运算优化的架构，成为了深度学习领域的核心加速器。本文将探讨如何利用GPU加速深度学习实验,突破性能瓶颈,提高模型训练和推理的效率。2.核心概念与联系2.1GPU架构GPU(图形处理器)最初是为了加速图形渲染而设计的,但由于其
使用大模型预测胃穿孔的全流程系统技术方案大纲
目录一、项目概述二、项目背景三、建设目标四、建设内容（一）建设架构（二）核心功能（三）核心技术（四）预期成效（五）方案总结五、系统架构方案流程图六、实验验证证据七、健康教育与指导一、项目概述本项目旨在构建一套基于大模型的胃穿孔预测及全流程管理系统，通过整合术前、术中、术后各环节数据，利用先进的人工智能技术，实现对胃穿孔疾病的精准预测、手术方案优化、并发症风险预警以及术后护理指导等功能，为医疗决策提
深度学习相关指标工作笔记 Victor Zhong AI 框架深度学习笔记人工智能
这里写目录标题检测指标iou/Ｇou/Ｄiou/ＣiouMSE(MeanSquaredError)(均方误差)(回归问题)交叉熵损失函数(CrossEntropyErrorFunction)(分类问题)检测指标iou/Ｇou/Ｄiou/ＣiouIntersectionoverUnion(IoU)是目标检测里一种重要的评价值交并比令人遗憾的是IoU无法优化无重叠的bboxes如果用IoU作为loss
【深度学习新浪潮】基于扩散模型的图像编辑加速方法小米玄戒Andrew 深度学习新浪潮深度学习人工智能扩散模型 Transformer DiT 图像编辑模型加速
在基于扩散模型的图像编辑任务中，实现高质量与高效加速的平衡需要综合运用模型架构优化、采样策略创新、条件控制增强及硬件加速等多维度技术。一、一步反演与掩码引导的编辑框架通过一步反演框架将输入图像映射到可编辑的潜在空间，结合掩码引导的注意力重缩放机制，实现文本引导的局部编辑。例如，SwiftEdit通过一步反演和注意力重缩放，将编辑时间压缩至0.23秒，比传统多步方法快50倍。具体步骤包括：一步反演：
表观遗传风暴：深圳AI-BioFab终极防御战全纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站⚡《表观遗传风暴：深圳AI-BioFab终极防御战全纪实》副标题：抗癌疫苗灌装倒计时90秒惊现组蛋白叛乱，中国启动虫洞计算化解文明级生物危机2025年7月2日14:26光明科学城急电当第184支抗癌疫苗注入冷链罐的瞬间，B3层突爆刺眼蓝光！培养舱内数千细胞染色体疯狂解旋，量子钟在14:26:03
医疗影像诊断新范式：多模态AI在癌症早筛中的落地难题 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站医疗影像诊断新范式：多模态AI在癌症早筛中的落地难题——2025年临床转化瓶颈突破与多中心验证报告残酷现实：FDA2025Q1报告显示，87%的AI影像工具因临床转化失败止步于III期试验破局曙光：斯坦福-梅奥联合研究证实，多模态融合使肺结节良恶性判别AUC提升至0.98（单模态上限0.91）一
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23