搬砖小孩Superme

具有小和不平衡数据的机器智能故障诊断：最新综述和可能的扩展

Intelligent fault diagnosis of machines with small & imbalanced data ：A state-of-the-art review and possible extensions

具有小和不平衡数据的机器智能故障诊断：最新综述和可能的扩展

如今人工智能的故障诊断技术已经取得了显著的成就，但由于机械通常工作在正常条件下，这就导致对于很难收集到足够多的故障数据。小和不平衡数据（S&I-IFD）的智能故障诊断，涉及使用有限的机器故障样本建立智能诊断模型以实现准确的故障识别。如今，S&I-IFD的研究已经取得了丰硕的成果，但缺乏对最新研究成果的回顾，未来的研究方向也不是特别清晰。为了解决这一个问题，这一篇文章回顾了S&I-IFD的研究成果，并提供了一些未来的展望。目前已有的研究成果主要分成以下三个类：基于数据扩充的策略、基于特征学习和基于分类器设计。基于数据增强的策略通过增强训练数据改善了诊断模型的性能。基于特征学习的策略通过从小和不平衡的数据中提取特征准确的识别故障。基于分类器设计的策略通过从小和不平衡的数据构建分类器实现高的诊断准确率。最后，这篇文章指出了S&I-IFD研究面临的挑战，并指出了一些可能带来突破的方向，包括元学习和零试学习。

引言

深度学习网络例如深度自动编码器（DAE）、深度卷积神经网络（DCNN）、和其它的深度网络，已经被广泛的用来构建端到端的智能诊断模型，这减少了对人工和专家知识的依赖，并极大的促进了人工智能诊断技术的发展。

小和不平衡数据的智能诊断涉及用少量的机器故障样本构建智能诊断模型以实现准确的故障识别。通常意义上来说，深度网络的智能诊断模型建立在大量的机器监控数据分析的基础上。越充足的训练数据，训练集中越大量的故障类型，智能诊断模型的诊断准确率越高。然后在实际的工程情境中，很难为智能诊断模型建立一个理想的数据集用于训练，理由有如下三条:

（1）在工程场景中，机器通常工作在一个正常条件下并且故障很少。因此，由多个传感器组成的条件监控系统能够从机器持续监控系统，这主要接收的数据都是健康数据，故障数据的数量很少。因此，很难获取足够多的故障数据用于智能诊断模型的训练。

（2）在实验室里通过故障模拟实验收集故障数据非常昂贵。

（3）通过计算机模拟故障数据是不现实的。计算机软件无法模拟机器复杂的工作环境，而工作环境对于故障数据有着显著的影响。

总而言之，在工程情景下的智能故障诊断是一个典型的小和不平衡数据问题。如果直接用有限故障数据训练智能故障模型，该方法泛化能力差，故障识别准确率低。

如何解决S&I-IFD引起了学者们极大的兴趣。例如，一些研究人员使用人工少数类过采样法去扩充故障样本的数量或用支持向量机发展故障分类器，因此诊断模型在故障数据样本不充足的条件下取得相对高识别准确度。最近，通过使用新的机器学习算法，S&I-IFD问题的研究取得了不错成果。例如：研究人员通过使用生成对抗网络（GAN）去模拟机器故障样本的数据分布，以至于产生更多的故障样本去扩充有限的故障数据集。此外，与迁移学习相关的诊断模型将以前学习到的诊断知识重用到新的诊断任务中，因此也可以使用少量故障样本实现准确的故障识别。

目前，在S&I-IFD上有许多的研究成果，然而，未来发展的研究方向不是特别清晰，同时对现有结果的回顾也比较缺乏。尽管，一些关于智能故障诊断的回顾已经出版，但对于缺乏数据样本的问题所提不多。而且现存的回顾主要是研究方法的一个概括，没有将机械设备当作一个特定的研究对象。从数据分析的观点上来看，机械监控数据的分析通常涉及频域分析，这与其它的数据分析如图像数据分析不同。

文章贡献

第一，文章关注智能机器故障诊断的小和不平衡数据问题，这是一个重要的研究点，但是与智能故障诊断相关的综述较少。这篇文章根据机器故障诊断的一般处理将S&I-IFD的成果分成了三个类：基于数据扩充的策略，基于特征学习的策略和基于分类器设计的策略。如下图所示：

从数据预处理的观点来看，学者通过数据生成和数据过采样扩充有限的故障数据，并且扩充的数据可以直接被用来训练智能故障诊断模型。在特征提取方面，通过设计正则化神经网络或特征自适应，可以直接从有限的故障数据中学习故障特征而不需要进行数据扩充。在状态分类方面，可以通过设计适用于小数据和不平衡数据的故障分类器直接对机器的健康状态进行分类，而无需进行数据扩充或设计特征提取模型。还可以利用迁移学习来设计分类器。

第二，基于现有的研究结果和最新的机器学习理论，这一篇文章提供了一些研究挑战和未来发展的方向。具体来说，在数据增强方面，现有的研究主要集中在扩充故障样本的数量，然而需要更加关注如何测量和增强样本的质量。如何防止诊断模型中的负迁移是工程应用的关键。而且，作为一个新的机器学习理论，元学习已经初步显示了它在解决小样本问题方面的优点。最后零样本学习可能会在根本没有故障样本的极端情况下为S&I-IFD带来突破。

研究方法和初步分析

本文主要收集了从2010年到2020年之间出版的关于S&I-IFD的论文。本篇综述论文已小样本学习和不平衡数据学习作为关键词进行参考文献检索，关键词树如下所示：

下图显示了2010至2020年与S&I-IFD相关的出版物的数量：

基于数据增强的策略用于S&I-IFD

使用少量数据进行数据生成、数据过采样和数据重新加权，可以对有限数据集进行扩充，从而有效的训练智能诊断模型。

使用生成模型进行数据生成：近来以生成对抗网络（GAN）和变分自动编码器（VAE）为代表的数据生成模型得到了深入的研究，并在许多领域显示出了较好的结果。该方法也适用于机械信号的生成。

基于GAN的方法：GAN有两个多层神经网络模块分别叫做生成器和鉴别器，如下图所示：

生成器从分布 $p_{z}$ 中采样随机噪声并生成数据 $x_{g}$ ，而鉴别器输出一个概率标量来区分真实数据 $x_{r}$ 和生成数据 $x_{g}$ 。假设 $G\left ( \cdot \right )$ 是生成器中的运算， $D\left ( \cdot \right )$ 是鉴别器中的运算， $L\left ( \cdot \right )$ 是生成器的目标函数。

GAN具体的训练过程描述如下：

自从GAN诞生，学者基于原始的GAN已经做出了许多的改进并产生了许多的变体。例如：深度卷积GAN（DCGAN）利用深度卷积神经去构建生成器和鉴别器，使他有可能产生高质量的图片。Wasserstein GAN利用Wasserstein距离修改原始损失函数，这使得训练过程比原始GAN更加稳定。还有其它许多的方法，GAN的程序流程和各种变形结构的流图如下：

GAN在数据生成中的运用：研究结果显示，在轴承故障数据有限的情况下通过GAN扩充的故障数据能够有效的改善齿轮、轴承、转子和其它元部件的故障识别性能。根据数据维度，这些研究结果可以被分成两个类：一维样本生成（1-D）和二维样本生成。在他们之间，一维数据的生成可以被分成三个类型。第一个是直接生成原始信号。采用GAN及其变体生成机器的监测信号，生成的信号可以被直接用来训练智能诊断模型。第二种是生成监测信号的频谱。与原始的监测数据相比，频谱也包含大量的故障信息并被广泛的运用于机器故障识别。第三是生成提取的数据特征。生成的故障特征也可以被直接用来训练故障分类器。由于特征的维度通常比原始数据的维度要低，生成数据特诊要比生成原始数据要更快、更容易。然而，生成的故障特征中所包含的信息可能不如原始数据中的信息丰富，这也是故障特征生成的缺点之一。

在另一方面，GAN最初用于2维图片的生成，因此，它便于处理2维数据。在机器故障诊断领域，研究者通常使用小波变换（WT）和其它的方法去获取原始信号的时域-频域特征，这些是原始信号的二维数据。GAN能够生成原始监测信号的时-频域特征，从而为智能诊断模型的训练服务。

作为一种流行的数据生成方法，GAN有能力生成与从工程情景中收集的真实故障样本相似的故障样本，因此能够扩展智能诊断模型的训练数据集。然而，GAN被应用于故障数据的生成时仍然存在两个问题。

首先，GAN很难训练。为了生成足够的故障数据，GAN需要消耗大量的计算资源并且需要很长的训练时间。其次，尽管GAN能够扩展故障数据的量，当训练数据不够充足时数据的生成能力会被限制。具体来说，GAN需要大量的数据来进行训练。训练数据越多，GAN学习的数据分布越接近真实的数据分布。然而，当只有少量的训练数据可以使用时，它很容易进入崩塌模式。在这种情况下，生成的样本接近于真实样本的副本，这意味着生成数据中所包含的故障信息非常有限。因此，使用这种低质量的生成样本作为训练数据，诊断模型的故障识别精度无法满足工程要求。因此，尽管GAN已经取得了许多成果，如何减少计算时间的消耗和在训练数据不充足时改善数据生成的能力仍然有巨大的研究空间。

基于VAE（变分自动编码器）的方法：变分自动编码器（VAE）是另一个常用的深度生成模型，处理流程如下图所示：

在数据生成方面，VAE可以从隐藏变量采样然后生成更多的数据。编码器的输入是数据，输出是由 $\mu$ 和 $\sigma$ 组成的隐藏变量z，编码器的权重和偏置是 $\theta$ 。在训练时，编码器将学习后验分布。隐藏变量z将会输入编码器去重构数据，解码器的权重和偏置是 $\vartheta$ 。解码器将会学习分布。

这里是隐藏变量的先验分布。表示Kullback–Leibler发散。

在VAE中是正态分布，是正态分布。因此，和之间的可以被描述为：

这里J是隐藏变量z的维度。在上边公式中，和可以通过编码器直接计算。隐藏变量z计算如下：

这里的ε 是一个噪声变量。

在VAE中，输出数据与输入数据有着较高的相似度因为数据重构损失在训练过程中被优化。同时，由于添加了噪声变量ε，生成的数据将与输入数据不完全一致，从而实现数据扩充。

VAE数据生成的应用：在智能故障诊断中，VAE被用来生成齿轮箱和轴承的故障数据。与GAN相比较，VAE的训练过程更加稳定，而且没有崩溃模式的问题。然而由于损失函数的不同，VAE生成的数据通常不像GAN生成的数据那样真实。因此，GAN进行数据增强的应用比VAE的更加流行。一些学者已经尝试联合VAE和GAN去生成机械数据。在未来如何使VAE生成的数据样本更加真实是一个需要解决的问题。

使用采样技术进行数据过采样：尽管如GAN和VAE之类的深度生成模型能够生成故障数据去支撑智能诊断模型的训练，但这些深度生成模型通常难以训练并且要求大量的计算资源。考虑到这一个问题，使用采样技术的数据过采样是另一个重要的方法用于扩充有限的数据。一些采样技术比如合成少数类超采样技术（SMOTE），在S&I-IFD问题上已经取得了许多成果。

一般来说，研究人员对少数类进行过采样或对主要类进行欠采样，以平衡数据集。然而下采样可能会丢失一些对数据分类可能有用的有价值信息。另一方面，过采样随机地复制训练数据，这可能导致分类器的过拟合。

通过分析少数类中的样本，SMOTE能够合成更多新的样本。SMOTE的处理过程如下图所示：

SMOTE在过采样数据中的应用：一些学者引入了SMOTE和它的改良变体去过采样机器故障样本。与深度生成模型相比较，SMOTE要求更小的计算资源，因此它能够合成大量的故障样本以满足智能诊断模型的要求。然而SMOTE当被应用于合成少数类中合成数据时存在数据分布边缘化的问题。具体而言，如果故障样本位于故障数据分布的边缘，则使用该故障样本合成的样本也将位于分布的边缘，这将模糊分类边界。因此，尽管SMOTE改善了训练数据集的平衡性，但当其陷入分布边缘化时，可能会增加故障分类的难度。

使用迁移学习的数据重加权：除了数据生成和数据过采样，在其它相关数据集帮助的下，还可以通过使用基于迁移学习的方法对数据样本重加权来实现数据扩充。

在缺乏故障数据的情况下，很难训练一个新的智能诊断模型。然而，如果通过训练的诊断模型学习的现有诊断知识可以重用，这个问题就可以得到解决。例如，我们可以使用实验室中收集到的轴承故障数据去训练一个诊断模型。该诊断模型学习的轴承故障诊断知识有助于工程场景下的轴承故障识别。迁移学习是实现这个目标有希望的方法，它意味着从一个任务学习的知识在另一个任务中再次运用。

一般来说，迁移学习有三个类：基于实例的迁移学习，基于特征的迁移学习和基于参数的迁移学习，具体取决于被迁移的组件。在他们之间，基于实例的迁移学习致力于从源域选取一些参数去改善在有限数据情况下的目标任务的性能。数据重加权是基于实例迁移最常用的策略。选定目标域数据样本的权重将会增加，而选定源域数据样本的权重将会减少。TrAdaBoost是迁移学习中最具代表性的数据重加权算法。

基于TrAdaBoost的方法：源域和目标域样本将会被TrAdaBoost重加权，从而平衡源域和目标域样本对训练模型的贡献。在AdaBoost中，如果目标域样本被诊断模型错误的分类，这个样本的权重将会被增加因为这个样本很难被正确的分类。另一方面，如果一个源域样本被诊断模型错误的分类，样本的权重将会减少因为该样本被认为对诊断模型的训练几乎没有帮助。因此，分类边界被移动到准确识别的目标数据的方向，如下图所示:

在智能故障诊断中，TrAdaboost算法被用来处理小样本情况。作为一种数据重加权算法，TrAdaBoost仅对数据进行操作，不参与特征提取和条件识别。因此，它很容易和多种先进的数据分类模型如深度信念网络和卷积神经网络相结合。然而，数据重加权的的性能与源域和目标域数据分布的相似性有关，如果他们之间有一个大的偏差，基于TradaBost的数据重新加权策略可能会导致目标诊断任务中的负迁移，这意味着从加权的故障样本将会导致一个差的诊断性能。

小结：在S&I-IFD中基于数据增强的策略有三个类：使用生成模型的数据生成，使用采样技术的数据超采样和使用迁移学习的数据重加权。前两种方法可以有效的扩充数据的体量。然而，他们有两个问题需要解决。首先，深度生成模型如GAN和VAE通常很难训练并且要求大量的计算资源，这意味着他们将很难进行实践应用。而且，但只有一个可用的训练样本时，生成的故障样本质量太低以至于不能满足智能诊断模型的要求，因为这些深度生成模型需要大量的数据去学习一个真实数据分布。其次，以SMOTE为代表的采样技术存在着数据边缘分布的问题，这可能增加准确识别故障的难度。基于迁移学习，数据重加权还可以通过在其它相关数据集的帮助下通过增加选定数据样本的权重扩充有限的数据样本。然而，数据重加权依赖源域和目标域数据分布的相似性，这容易降低诊断模型的性能。因此，有必要寻找新的高效数据扩充方法，以进一步提高S&I-IFD的诊断性能。

基于特征学习策略的S&I-IFD

此外除数据扩充之外，S&I-IFD问题也可以通过诊断模型从小和不平衡的样本中学习有效的故障特征进行解决。其方法主要分为两个类：（1）通过设计像稀疏神经网络这样的正则化神经网络，诊断模型能够从小和不平衡的数据中直接提取故障特征。（2）在其它相关数据集的帮助下，基于迁移学习的特征自适应也能够从小和不平衡的数据中学习故障特征以实现准确的故障识别。

使用正则化的神经网络进行特征提取:最近的研究结果显示，正则化的神经网络能够有效的处理小和不平横的数据。在这些研究成果中，深度自动编码器(DAE)和深度卷积神经网络（DCNN）作为基本模型收到青睐。

DAE：自动编码器是一个典型的无监督模型，如下图所示：

DCNN：与AE比较，卷积神经网络（CNN）只有较少的训练参数，但具有很强的特征提取能力。CNN包含卷积核池化层。CNN由卷积层核池化层构成，卷积层通过卷积操作学习输入数据的特征向量，另一方面，池化层用于欠采样，它能够减少特征向量的大小和参数的数量。整体过程如下图:

与DAE相同，DCNN能够通过堆叠卷积核池化层构建DCNN。

正则化DAE和DCNN在特征提取中应用：有着深度网络结构的DAE和DCNN通常需要大量的数据用于训练，因此他们并不适合直接处理小和不平衡的数据。幸运的是正则能够帮助DAE和DCNN用很少的训练数据进行训练同时确保泛化能力。在智能故障诊断中，正则化的神经网络能够从很少的样本中提取特征并实现准确的故障分类。有三种常用的正则化神经网络，即稀疏神经网络、归一化神经网络和集成神经网络。在他们中稀疏神经网络通过权重衰减减少网络参数以降低过拟合的风险，从而在有限训练数据的情况下确保了泛化能力。其次，归一化神经网络通过对权值进行归一化，减少了数据不平衡对训练过程的不利影响，保证了在数据分布不平衡的情况下具有很强的数据分类能力。最后，集成神经网络融合数据，防止网络在小样本情况下过拟合。特别是有两种融合数据，即提取特征和分类结果。

总的来说，DAE和DCNN拥有强大的数据处理能力，并能从大量的监测数据中自动地提取故障特征。然而，这种深度模型通过最小化经验风险来更新参数，这意味着当训练样本不足时他们可能出现过拟合。尽管最近研究显示正则化的网络能够改善他们的泛化能力，值得注意的是如何设计高质量的正则化方案用于深度神经网络是一个困难的问题，需要大量的研究经验，因为正则化的方法有很多的选择。此外，与其它标准的DAE和DCNN相比较，正则化的网络结构通常更加复杂和难以训练，由于引入了如稀疏惩罚项之类的因子。

基于其它算法的方法:除了正则化的DAE和DCNN，其它的神经网络在从小和不平衡数据学习特征也已经取得了一些成果。

使用迁移学习的特征自适应：除了直接提取特征，在其它数据集的帮助下特征自适应是一个从小和不平衡的数据提取故障特征的重要方法。在迁移学习场景中，目标域数据样本的数量通常比源域样本小得多。此外由于源域和目标域数据分布不同，他们的特征通常不同。基于迁移学习的特征自适应，尝试最小化两个域之间特征分布的差异，因此目标域的特征能够被模型很好的学习。如下图所示：

不仅迁移元素分析（TCA），通过使用联合分布适应（JDA）、深度神经网络（DNN）和其他方法，在S&I-IFD方面也取得了许多成就。

这里c类中的来自源域的样本数量为，来自目标域的样本数量为。

TCA和JDA进行特征自适应的应用：一些学者引入TCA和JDA到他们迁移学习方案中进行特征自适应。传统的基于TCA和IDA的特征自适应方法计算简单并能够减少两个域之间特诊分布的差异。然而，两种方法都通过将低维原始数据映射到高维希尔伯特空间来缩小两个分布之间的不同。当遇到复杂高维的机器数据时，他们不能够很好的拟合。因此与TCA和JDA相关的模型在面对复杂诊断任务时诊断准确率通常较差。

基于深度神经网络的方法：与TCA和JDA不同，深度神经网络能够直接从原始数据样本中直接学习数据特征，通过最小化目标域和源域特征的分布差异。作为一种基础的分布差异距离度量，一些学者建立了基于Kullback–Leibler (KL) 散度的深度迁移诊断模型以实现特征自适应。例如一种叫做自动平衡KL发散（AHKL）的分布差异度量被提出来用于故障特征自适应。特征提取后，用AHKL测量两个域特征的一阶矩和高阶距差异，他们之间的差异将会通过如下方法减少：

除了KL发散，其它用于测量分布差异的距离度量是最大差异。许多基于深度神经网络特征自适应的研究成果已经将MMD应用于小样本问题的诊断。

除了最小化距离度量，其它使用深度神经网络用于特征自适应的方法是对抗训练。受GAN的启发，对抗训练也能够减少两分布之间的分布差异。

由于其强大的数据处理能力，基于深度神经网络的特征自适应方法通常比传统的TCA和JDA能输出更好的诊断结果。然而，特征自适应能力有时取决于距离度量。此外，基于深度神经网络的特征自适应方案假设两个领域的特征空间在一定程度上重叠，但现有研究无法判断它们之间是否存在重叠。如果不能明确描述特征分布的差异，诊断模型在目标诊断任务中可能表现不佳。

小结

基于特征学习的方法主要可以分为两类（1）使用正则化的神经网络直接从有限的故障数据中提取特征（2）在其它数据集的帮助下基于迁移学习的特征自适应。但基于特征学习的策略也存在着缺点。首先，少量的故障数据所能提供的故障信息通常是有限的，基于特征学习的模型提高的诊断性能也是有限的。其次，基于迁移学习的特征自适应要求不同数据集之间的特征分布具有相似性，这在真实的工程情景是很难满足的，而且需要选择合适的距离度量函数。

基于分类器设计的策略

在智能故障诊断中使用故障分类器进行进行故障分类为最后一步。根据是否使用辅助数据集，分类器的设计有以下两种思想:（1）使用小和不平衡数据直接修改初始的故障分类器，如：构建一个代价敏感故障分类器（2）用相关数据集提前预训练一个分类器再通过迁移学习达到好的分类性能。

使用小和不平衡数据集设计故障分类器：作为一个处理小样本的专业模型，支持向量机（SVM）和他的变体能够改善有限故障数据样本的故障分类准确率。此外，代价敏感学习致力于通过应用成本敏感损失函数从不平衡的数据分布中学习信息

基于SVM的方法：SVM致力于在特征空间中寻找一个超平面，从而尽可能正确的分类数据样本。如下图所示：

支持向量机在故障诊中的应用：一些研究者利用SVM和它的一些变体去分类有限的故障数据。通常，基于支持向量机的故障分类器通过最小化训练样本的整体结构风险进行优化。因此与通过最小化经验分享进行优化的深度神经网络相比，他们更适合解决有限故障数据的问题。然而，两个缺点约束了SVM的应用。首先，SVM的诊断准确率对于所设置的和参数敏感。其次，尽管SVM擅长处理小样本问题，它很难适应大量的监测数据。随着数据采集技术的发展，机器的监测数据迅速增加，这将给基于支持向量机的故障分类器带来计算挑战。

基于代价敏感的方法：代价敏感学习将会给出一个分类任务中不同类别的不同错误分类损失。代价敏感损失致力于减少在整个数据集上的所有错误分类代价。换言之，成本敏感学习将更多地关注少数类中的样本，以提高在不平衡数据集上的整体分类性能。

其中代类k的样本数量，是一个指示函数。基于数据不平衡率进行损失的设计，这个分类模型会更注意少数类从而改善少数类的识别准确率。

总体而言，代价敏感学习通过错误分类损失分配更加关注少数类中的故障样本，保证了少数类故障样本的故障识别准确性。代价敏感故障分类器的输出对代价敏感损失函数的设计非常敏感。目前的研究成果大多是基于数据不平衡率建立成本敏感损失函数，这确实是有效的，但如何对其进行更新以获得更好的结果仍然值得探索。未来，可能的解决方案之一是使用注意机制自动设置代价敏感损失函数，该机制已成功应用于敏感信息选择和自适应权重分配。

基于参数迁移的方法：首先诊断模型的参数通过使用充足的源域数据进行预训练。之后，使用少量的目标域数据对预训练模型的分类层进行微调。这种基于参数迁移的方法相对简单，但被广泛使用。

一般来说，源域数据集的大小，将会影响通过基于参数迁移方法获得的故障分类器的识别准确率。用于预训练的源域数据集越大，获得的故障分类器的性能越好。然而在实际上很难构建一个理想的预训练数据集，这是基于参数迁移进行分类器设计应用的主要问题。如果源域数据集不够大，用这种方法得到的故障分类器对目标诊断任务的诊断性能会很差。

小结

根据是否使用辅助数据集，基于故障分类器设计的策略有两种。第一种方法是直接利用小数据和不平衡数据设计故障分类器，例如优化支持向量机或开发代价敏感的分类器。这种方法通常依赖于研究人员的工程经验，尤其是代价敏感损失函数的设计，因此很难获得最优结果。第二种方法是使用辅助数据集对诊断模型进行预训练，然后用少量故障数据对分类器进行微调，得到最终的故障分类器。以这种方式获得的故障分类器的性能取决于辅助数据集的质量。但辅助数据集不够大时，故障分类器的分类能力通常不够强。

S&I-IFD未来的挑战和可能的扩展

（1）如何改善S&I-IFD中增强样本的质量？

当训练样本太小时，生成模型生成的样本与真实样本太相似，这意味着通过这种方式增加的故障信息非常有限。目前的存在的而数据增强策略，通常是为每一个数据集特别制订的，不能够简单的用于其它数据集。

在未来的研究中，对于数据增强的方法，不仅要注重数量的扩充还需要注意质量的提升。可以采用自动增强技术，基于半监督学习的模型

其次，如何建立样本质量评价指标也是一个重要的议题。不能够进近局限于生成样本和真是样本之间的相似性，这会导致信息的冗余。

（2）如何防止S&I-IFD中基于迁移学习的方法出现负迁移？

迁移学习在三种策略中均有运用，对于处理S&I-IFD问题是一个重要的方法，但当出现负迁移时，该方法在缺乏数据样本的情况下表现很差。负迁移是指在源域提取的指示在目标任务造成损害。如果目标域和源域数据的分布差异过大负迁移将会出现。例如，源域数据时轴承故障样本而目标域数据是齿轮故障样本，从轴承故障样本中学习到的知识是毫无意义的，甚至对齿轮故障诊断有负面影响。

首先为了描述源域和目标域的分布差异，需要制订合理的测量规则。在未来的研究中，开发一个分布相似性度量是值得探索的。

其次为了建立有效的诊断模型，传递性迁移学习的也是不错的选择。与传统的只涉及两个领域的迁移学习方法不同，传递性迁移学习将多个相关领域连接起来，并以传递的方式更新所学知识，为构建基于迁移学习的S&I-IFD诊断模型提供了一种可行的思路。

（3）元学习的相关理论和在S&I-IFD上的应用

不同于传统的基于数据的学习，元学习变成了基于任务的学习，从多个相关任务中获取可以迁移的知识，并采用情景训练的策略，最终可以将学习到的知识应用到的任务且不需要微调。

通常来说，元学习可以分为三个类：基于优化的方法，基于模型的方法，基于度量的方法。其中基于优化的模型旨在学习元知识，这是网络的初始化参数，然后通过少量的训练样本进行迭代，以获得一个良好的分类器。基于模型的方法擅长数据高效的少样本学习。他们可以将当前的训练数据嵌入激活条件，并根据这个条件预测测试数据。循环神经网络、卷积神经网络和超网络是典型的基于模型的元学习结构。最后，通过比较训练数据集和验证数据集对基于度量的方法进行训练。孪生网络，匹配网络，原型网络和关系网络是典型的基于度量的元学习模型。

总体而言，基于元学习的模型有两个明显的特点。首先基于元学习的模型通过学习任务“N-way-K-shot”进行训练。其次，基于元学习的模型具有很强的泛化能力。一些模型，如匹配网络能够在包含新类型数据的分类任务中有很好的性能，这意味着元学习能够很好的解决工程情景中的实际问题。

（4）零试学习的理论及在S&I-IFD应用的可能

零试学习使用在实际工作中收集的可见数据进行训练，并实现对没有收集的不可见类数据进行识别。在工程场景中，许多收集到的数据在正常的工作条件下，故障数据很少。在极端情况下，研究者无法在一个确定的故障类型或工作条件下获取故障信号，这意味着诊断模型没有来自不可见数据类的训练样本。在智能故障诊断中，识别不可见数据类是一个很难的任务，使用一般的诊断模型很难完成。

零试学习通过从可见类到不可见类的推理来实现不可见类的识别，这在图像识别领域已经得到了广泛的运用。零试学习主要包含模型嵌入和特征生成。通过在可见类上的训练，模型可以学习到数据特征和他们属性（语义）之间的映射关系，同时预先定义属性（语义）和数据标签之间的相关性。

如何根据不同的监测目标和数据类型有效的描述数据属性（语义）是未来一个关键的研究方向。除此之外，如何学习和生成一般的数据特征是零试学习的重要基础。这些现有的研究成果主要是基于自动编码器来生成未知类中的数据特征。未来，如何利用GAN等其他模型实现特征学习和生成是一个必要的研究方向。

全文总结

长期以来，S&I-IFD一直受到学者们的关注。本文回顾了S&I-IFD的研究成果，将其分为三类：基于数据增强的策略、基于特征学习的策略和基于分类器设计的策略。具体而言，基于数据增强的策略通过生成、过采样或重新加权训练数据样本，提高了对小数据和不平衡数据的诊断性能。基于特征学习的策略使用正则化神经网络或特征自适应从小的不平衡数据中学习故障特征。基于分类器设计的策略通过设计适用于小数据和不平衡数据分类的故障分类器，实现了较高的诊断准确率。对于未来的研究，如何提高增强样本的质量是一个需要更多关注的问题。此外，如何防止基于迁移学习的诊断方案的负迁移是工程应用中的一个挑战。最后，元学习理论和零试学习理论在解决S&I-IFD问题上有很大的潜力，这可能会带来未来的研究突破。

附录：

对于本文所涉及的相关概念名词进行了简要归类

（1）迁移学习

（2）正则化的神经网络

（3）元学习

你可能感兴趣的:(故障诊断,小样本学习,零试学习,深度学习,人工智能)

【北上广深杭大厂AI算法面试题】深度学习篇...MobileNet 系列网络发展与高效性分析（附代码）（二）努力毕业的小土博^_^ AI算法题库人工智能算法深度学习卷积神经网络
【北上广深杭大厂AI算法面试题】深度学习篇…MobileNet系列网络发展与高效性分析（附代码）（二）【北上广深杭大厂AI算法面试题】深度学习篇…MobileNet系列网络发展与高效性分析（附代码）（二）文章目录【北上广深杭大厂AI算法面试题】深度学习篇...MobileNet系列网络发展与高效性分析（附代码）（二）MobileNet系列网络发展与高效性分析（附代码）4.MobileNetV2（2
小白必看！2025 网络安全保姆级学习路线来啦~ 白帽黑客-晨哥学习 web安全安全数据库 php
关键词：网络安全入门、渗透测试学习、零基础学安全、网络安全学习路首先咱们聊聊，学习网络安全方向通常会有哪些问题1.初学者常见问题1.1如何开始学习网络安全？问题：网络安全领域广泛，初学者往往不知道从哪里入手。解答：从基础知识开始：学习计算机网络、操作系统、编程语言（如Python、Bash）。了解网络安全的基本概念，如加密、认证、漏洞、攻击类型等。使用在线资源（如Cybrary、OWASP）或书籍
华为OD-不限经验，急招，机考资料，面试攻略，不过改推，捞人 2301_79125642 java
超星(学习通)-Java后端一面网易互娱40min（感觉是G了）一篇不太像面经的面经2023总结，前端大二上进小红书秋招面经第一波海康红外图像算法实习（微影）面经测试工程师社招-测试面试题大厂在职傻屌。TPlink图像算法工程师一二三面经深圳海康红外图像算法实习（微影）面经TPLink提前批面经（已OC）传统车辆转规控算法岗秋招记录腾讯TEG测试与质量管理全记录瑞幸Java开发校招一面腾讯金融科技
Docker中GPU的使用指南俞兆鹏云原生实践 docker 容器运维
在当今的计算领域，GPU（图形处理单元）已经成为了加速各种计算密集型任务的关键硬件，特别是在深度学习、科学模拟和高性能计算等领域。Docker作为流行的容器化平台，允许开发者将应用程序及其依赖打包成一个可移植的容器，在不同的环境中运行。当需要在Docker容器中利用GPU的计算能力时，我们需要进行一些特定的配置和设置。本文将详细介绍如何在Docker中使用GPU，从环境准备到实际应用，帮助你充分利
大模型最新面试题系列：训练篇之模型监控与调试人肉推土机大模型最新面试题集锦大全面试人工智能 pytorch AI编程语言模型
1.训练过程中需要监控哪些关键指标？如何设置报警阈值？关键指标损失函数值：包括训练损失和验证损失，反映模型在训练和验证数据上的拟合程度。准确率：分类任务中的预测正确样本占总样本的比例，评估模型的预测能力。召回率和F1值：在二分类或多分类任务中，用于更全面地评估模型性能，特别是在正负样本不均衡的情况下。学习率：监控学习率的变化，确保其处于合适的范围，避免学习率过大导致模型不稳定或过小导致训练收敛过慢
【MATLAB源码-第164期】基于matlab的轴承故障三种谱图：细化谱，功率谱，倒谱对比分析仿真。 Matlab程序猿小助手通信原理 matlab 开发语言算法机器人人工智能机器学习计算机视觉
操作环境：MATLAB2022a1、算法描述轴承故障分析是一种重要的维护和监控手段，能够帮助工程师及时发现和解决轴承在运行中可能遇到的各种问题。在轴承故障诊断中，通常会使用到三种谱图分析方法：细化谱（FineSpectrum）、功率谱（PowerSpectrum）和倒谱（Cepstrum）分析。这三种方法各有特点，适用于不同的故障类型和分析场景。以下是对这三种谱图的详细描述。细化谱分析理论基础细化
【华为OD机试真题E卷】54、统一限载货物数最小值 | 机试真题+思路参考+代码解析（C++、Java、Py） KFickle Java Py）华为od c++java 华为OD机试真题统一限载货物数最小值
文章目录一、题目题目描述输入输出样例1样例2二、代码与思路参考C++代码Java代码Python代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题D、E卷，每题都使用C++，Java，Python语言进行解答，每个题目的思路分析都非常详细，持续更新，支持在线OJ刷题，订阅后评论获取权限，有代码问题随时解答，代码仅供学习参考一、题目题目描述火车站附近
地球科学数据学习笔记---流向与风向、浪向 fried-ghost 地球科学数据学习笔记学习笔记数据分析
一、流向（current）流向一般指流体前进的方向、去向，一般以正北方向为正，例如流体从南流向北，则流向为0°，其示意图如下二、风向与浪向风向与浪向一般都指来向，与流向相反，例如风从南吹向北，则为南风，风向为180°。气象数据中一般会将风速数据存成u、v两个分量（雷达数据除外），u分量表示纬向风，v分量表示经向风。u为正，表示西风，风向为270°；v为正，表示南风，风向为180°。示意图如下所示，
基于NLP的客户意见分析：从数据到洞察 Echo_Wish Python 算法 Python 笔记自然语言处理人工智能
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
深入理解Kettle：ETL工具的学习与实践未知方程无解
本文还有配套的精品资源，点击获取简介：Kettle（Spoon）是Pentaho公司开发的开源ETL工具，用于数据整合和数据仓库建设。本学习笔记着重于Kettle的核心——转换引擎，详细探讨其数据处理的各个步骤，包括数据的输入、转换、输出以及工作原理，提供了一系列的学习资源和实践操作指南，旨在帮助学习者深入理解并掌握Kettle的转换引擎，从而提升数据处理能力。1.Kettle（Spoon）简介与
c语言共用体变量赋值,（C语言）共用体union的用法举例王麑 c语言共用体变量赋值
以前在学校学习C语言的时候一直搞不懂那个共用体union有什么用的。工作之后才发现它的一些妙用，现举例如下：1.为了方便看懂代码。比如说想写一个3*3的矩阵，可以这样写：[注：下面用红色部分标记的地方是后来添加上去的，谢谢yrqing718的提醒！]structMatrix{union{struct{float_f11,_f12,_f13,_f21,_f22,_f23,_f31,_f32,_f33
具身智能行业 [shenhonglei] 具身觉醒：智能进化的未来之路人工智能机器人
具身智能行业综合分析资源下载-具身智能导图.xmind资源下载-具身智能导图.xmind一、行业概况定义与核心特征具身智能（EmbodiedAI）指通过物理实体（如机器人、自动驾驶设备等）与环境的动态交互，实现感知、认知和行动控制的智能系统。其核心特征是“知行合一”，强调通过实际交互提升智能水平，而非仅依赖数据训练。技术融合：结合人工智能（AI）、机器人技术、多模态大模型
【AGI】中国大模型扛把子：通义家族 LeeZhao@ AIGC重塑生活神器 agi 人工智能 AIGC 面试自然语言处理语言模型
中国大模型扛把子：通义家族引言一、通义千问的技术架构与模型谱系二、技术突破与性能优势三、开源生态与行业影响四、未来展望：从“千问时代”到通用智能五、通义家族大模型列表（1）多模态大模型（2）大语言模型结语引言在人工智能大模型领域，中国科技企业正以惊人的速度突破技术边界。阿里云推出的**通义千问（Qwen）**系列大模型，凭借其多层次的技术架构、多样化的模型生态及开源战略，已成为全球AI领域的重要标
Bert模型学习笔记文三路张同学其他 bert 学习深度学习
Bert模型学习笔记Fromhttps://www.bilibili.com/video/BV1Ey4y1874yemmm讲实话这个视频太简单了，不建议看。可以看看李沐的视频：https://www.bilibili.com/video/BV1PL411M7eQ这篇文章主要是四个部分：bert的整体架构如何做预训练mlm+nsp如何微调bert(没看)代码解析(没看)Bert架构基础架构是Tran
AdaBoost算法 Mr终游机器学习算法决策树
目录一、核心原理：二、算法步骤三、关键优势：四.局限与解决五、代码示例（鸢尾花数据集）AdaBoost（AdaptiveBoosting）是一种经典的集成学习算法，通过组合多个弱分类器（如决策树）来构建强分类器。其核心思想是通过迭代优化残差（错误）和动态调整样本权重，逐步提升模型性能。以下是对AdaBoost的简明总结和关键要点：一、核心原理：提升法：通过顺序训练多个弱分类器，每轮专注修正前一个模
HarmonyOS：如何实现自定义的Tabs,TabContent内部实现如何动态配置 zzialx 鸿蒙专栏 harmonyos 华为 android
前言：最近做开发任务的时候，想把Tabs自定义了，并且动态配置TabContent里面的内容，不是写死一样的，这个问题困扰了很长时间，试过**@BuilderParam**（类似于vue的插槽）传组件方式的，但是**@BuilderParam只能传一个，我想要传递的是一个数组，找了很多Api最后找到了WrappedBuilder[]**这种方式。废话不多说，直接上代码，因为大部分的学习者都是先看代
Bert学习笔记缓释多巴胺。大模型相关知识语言模型 bert
一、Bert架构BERT使用了双向的TransformerGPT使用从左到右的单向信息ELMo把单独训练的从左到右及从右到左的LSTM模型进行合并二、Bert预训练任务2.1遮蔽语言模型MLM任务：随机屏蔽（masking）部分输入token，然后只预测那些被屏蔽的token。问题：预训练任务与微调任务不一致原因：在finetuning期间从未看到[MASK]token，预训练和finetunin
Windows零门槛部署DeepSeek大模型：Ollama+7B参数模型本地推理全攻略 zxg45 AI大模型 deepseek 硅基流动 AI大模型
一、为什么选择Ollama+DeepSeek组合？1.1DeepSeek模型的三大核心优势中文语境霸主：在C-Eval榜单中，7B参数版本以82.3%准确率超越Llama2-13B6硬件友好：Int4量化后仅需5.2GB存储空间，GTX1060即可运行多模态扩展：支持与StableDiffusion联动生成图文报告1.2Ollama的颠覆性价值相较于传统部署方式，Ollama带来三大突破：开箱即用
R语言机器学习系列-随机森林回归代码解读 Mrrunsen R语言大学作业机器学习回归 r语言
回归问题指的是因变量或者被预测变量是连续性变量的情形，比如预测身高体重的具体数值是多少的情形。整个代码大致可以分为包、数据、模型、预测评估4个部分，接下来逐一解读。1、包部分，也就是加载各类包，包括随机森林包randomForest，数据相关包tidyverse、skimr、DataExplorer，模型评估包caret。2、数据部分，主要是读取数据，处理缺失值，转换变量类型。3、模型部分。为了对
【学习笔记5】Linux下cuda、cudnn、pytorch版本对应关系 longii11 linux pytorch 运维
一、cuda和cudnnNVIDIACUDAToolkit（CUDA）为创建高性能GPU加速应用程序提供了一个开发环境。借助CUDA工具包，您可以在GPU加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和HPC超级计算机上开发、优化和部署您的应用程序。该工具包包括GPU加速库、调试和优化工具、C/C++编译器以及用于部署应用程序的运行时库。全球的深度学习研究人员和框架开发人员都依赖cuDN
大语言模型对程序员行业的影响及未来发展走势分析 Hello kele 人工智能 java 人工智能 AI编程
随着人工智能技术的快速发展，特别是大语言模型（如DeepSeek、OpenAI、Grok等）的出现，对程序员这个行业产生了深远的影响。在这篇文章中，我们将探讨这些变化，分析影响，并展望未来的发展趋势。一、当前影响1.自动化代码生成大语言模型的一个直接影响是代码自动化的能力。这些模型可以理解代码上下文，并生成功能性代码。例如，GitHubCopilot已经成为许多开发者的辅助工具，能够根据注释或部分
【AI辅助工具】Trae和Cursor 对比分析 Hello kele 人工智能 AI编程
Trae和Cursor都是旨在提升编程效率的AI辅助工具，但在功能、定位和用户体验上有所差异。Trae：Trae是字节跳动推出的AI集成开发环境（IDE），专为中文开发者设计，提供全中文界面，符合国人使用习惯。主要特点：智能问答与代码自动补全：支持通过自然语言描述需求，自动生成相应的代码，减少手动编写代码的时间。Builder模式：类似于Cursor的Composer功能，帮助用户从零开始构建完整
DeepSeek：AI赋能的无限可能——从日常生活到职业进阶的全场景探索 Hello kele 人工智能人工智能
引言在人工智能技术飞速发展的今天，DeepSeek作为一款国产AI工具，凭借其强大的推理能力、自然语言处理效率和场景化应用潜力，正在重塑人类解决问题的方式。从撰写演讲稿到制定投资策略，从家庭教育到企业管理，DeepSeek通过“自然语言对话”的交互模式，将复杂任务简化为几步提示词的输入，真正实现了“所想即所得”。本文将从七大核心场景出发，系统解析DeepSeek如何成为个人与组织的智能助手，推动效
Leetcode 刷题笔记1 动态规划part05 平乐君 leetcode 笔记动态规划
开始完全背包不同于01背包，完全背包的特色在于元素可以重复拿取，因此在递归公式和遍历顺序上都有些许不同。leetcode518零钱兑换||在组合方式中所用到的递推公式是dp[j]=dp[j-coins[i]]+dp[j]对于coins[i]>j的情况，forjinrange(coin[i],amount+1)不会执行，即实现dp[i][j]=dp[i-1][j]classSolution:defc
Leetcode 刷题笔记1 动态规划part06 平乐君 leetcode 笔记动态规划
leetcode322零钱兑换由于本题所求为最少零钱数所以递推公式中应该为dp[j]=min(dp[j],dp[j-coin]+1)classSolution:defcoinChange(self,coins:List[int],amount:int)->int:dp=[float('inf')]*(amount+1)dp[0]=0forcoinincoins:forjinrange(coin,a
贪心算法-移除K个数字我是你的春哥！贪心算法算法 java
1、题目描述给定一个以字符串表示的非负整数num，移除这个数中的k位数字，使得剩下的数字最小。注意：num的长度小于10002且≥k。num不会包含任何前导零。2、题目分析：题目简介明了，就是把给定的数字删除指定个数的数字使删除之后的数字是同等位数数字中最小的那个。但是需要注意的是，题目中给的数字是字符串的形式并且输出结果也是字符串的形式，这就涉及到字符串和数字之间的相互转化问题。题目中要求删除的
RAG 检索增强生成：技术详解与应用展望君君学姐 RAG检索增强生成
RAG检索增强生成：技术详解与应用展望一、引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了前所未有的变革。其中，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）作为一种新兴的技术框架，正逐渐成为大模型应用中的热门选择。RAG通过结合信息检索（IR）和自然语言生成（NLG）的能力，旨在提升模型在回答问题、生成文本等任务中的准确性和可靠性。本文将深
# React源码解析之Reconciler运行循环与scheduler调度 Bug程序员枯港后端
React源码之看完吊打面试官系列经历一个月的学习整理，站在前人的肩膀上，对React有了一些浅薄的理解，希望记录自己的学习过程的同时也可以给大家带来一点小帮助。如果此系列文章对您有些帮助，还望在座各位义夫义母不吝点赞关注支持，也希望各位大佬拍砖探讨本系列行文思路如下,本篇属于React中的React的管理员(reconciler与scheduler)[X]React启动过程[X]React的两大
【无标题】四色定理拓扑证明的数学强化与物理深化框架 2301_81062744 拓扑学
###**四色定理拓扑证明的数学强化与物理深化框架**---####**一、拓扑收缩的数学严谨性补全**#####**1.1零点插入的平面性保持证明**-**Kuratowski定理应用**：验证插入零点后的图$G'$不含$K_5$或$K_{3,3}$子图。-**引理**：每次插入零点仅增加2度顶点，不改变图的平面类。-**证明**：设原图$G$为平面图，插入零点$p$将边\(
数据结构难学吗，如何才能学会？玩转C语言和数据结构数据结构算法 c语言
本教程发布以来，有很多读者想我请教学习数据结构和算法的方法。接下来，我就结合自己学习数据结构的经历，谈谈学习数据结构的门槛，告诉大家一些学习数据结构的方法，帮大家规避一些学习数据结构和算法过程中可能会踩的坑。提示：想系统学习数据结构的小伙伴，推荐一个网站：数据结构与算法教程（C语言版）https://xiexuewu.github.io/这里有一整套的数据结构和算法教程，提供有完整、可运行的C语言
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 fred@myhost.com # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla