XD_onmyway

一篇关于轴承故障诊断的综述

在设备的故障检测中，有约30%-40%的设备故障是由轴承故障引起的，因此本文将列举有关检测轴承故障使用到的相关数据集，模型和算法。

数据集

现有的数据集，普遍由固定在电机马达上的两个震动检测器获得，并根据需要，分离震动数据在时域和频域上的特征以供网络模型学习。

不同的数据集，区别在于，检测的马达转速不同，环境不同，取样频率不同，一段样本的时长不同等等

（1）Case Western Reserve University (CWRU) Dataset

该数据集拥有多种数据，测量的时候，通过改变轴承的直径，检测的位置，马达的负载和转速，取样的频率等方式，在有限的实际设备中，生成多种有效数据。

CWRU数据集在实际使用中相当大众，是训练网络模型和检测网络性能的基本数据集。

但数据大多来源于实验室内，数据不够广泛，也不够真实。

（2）Paderborn University Dataset

该数据集在搞分辨率和高采样率的条件下，同步检测电机电流和振动信号。被检测的轴承中，26个为故障轴承，6个健康轴承。故障轴承中，12个为人为损坏，14个为加速寿命造成的更实际的损伤。人为的损坏多为人工钻孔或者人工划损；加速寿命所带来的故障数据，在使用上来说，更具真实性，它更多是因为老化而逐渐失去润滑。

它在提供振动信号的同时，也提供相对应的电流信息，促进完善着基于多物理特性的网络学习模型。

（3）PRONOSTIA Dataset

比起检测轴承故障，该数据集更多是用在检测轴承的剩余有效时间（remaining useful life--RUL）。

它主要提供了在不同条件下的，真实的加速老化轴承数据。收集数据的传感器为转子传感器和压力传感器。

在高频率收集振动数据的同时，它也在监测着轴承的温度数据，便于神经网络从多个物理特性确定轴承的RUL。

（4）Intelligent Maintenance Systems (IMS) Dataset

与普通的数据集不同，该数据集记录的不是人工造成损坏或者通过施加轴电流造成的加速老化故障，IMS数据集包含轴承缺陷演化的完整记录。yue

在一次故障出现之前，一个轴承要在2000转速情况下，连续运行30天，共约经历8千6百万次循环。

同样的，该数据集在监控震动信号的同时，也监督着轴承的温度（用来检测马达的润滑程度），适用于检测轴承的RUL。

图表总结

传统机器学习方法（ML）

与DL的自动提取特征，自动学习模式不同。传统的ML往往需要大量的专业知识和复杂的特征工程，也就是专业人员人工操作处理。先对数据集执行深入的探索性数据分析，再由PCA或者其他方法对数据进行降维处理，最后才是特征提取。其中最麻烦的还是人工的步骤，不同领域的专业知识交叉并不多，在不同的领域研究问题，往往需要多个该领域的专业人员进行手动特征提取，这导致研究成本的增大。

（1） Artiﬁcial Neural Networks (ANN)

人工神经网络基本可以算是最原始的神经网络，该网络训练的时候，以定子电流和电机转速测量作为输入（这种方法还需要一个额外的速度编码器来收集电机速度信号作为额外的输入），以预测的轴承条件作为输出。数据集也是在实验室里头，用不同的工况条件采集出来的，35个训练数据，70个测试数据。最终得出的准确率达到了 94.7% 。

（2）Principle Component Analysis (PCA)

PCA算法多用于对数据进行降维，通过计算原始数据集中的信息可用度，去除冗余信息，向用户提供这个对象的低维投影，作为网络模型的输入，这有助于缩短网络模型的训练时间和降低网络训练所需要的计算量。

实验证明，使用PCA提取出来的降维特征学习，要比用原始数据直接学习效果更好，准确率能从88%提升到98%。

（3）K-Nearest Neighbors (k-NN)

它是一种无参数的方法，常用于分类或者回归。通过数据最近的K个邻居的投票，最终决定该数据的类型。故障检测中，采用该方法来确定轴承的故障具体属于哪一个故障类。

（4）Support Vector Machines (SVM)

支持向量机是一种监督学习模型，它分析用于非概率分类或回归分析的数据。同样用于给轴承故障进行分类。

ML目前遇到的问题：

1.滑动：当前故障检测是假定滚动件和轴承滚道之间不发生滑动的基础上实现的，但在现实情况下，这种滑动并不少见

2.频率相互影响：多种故障同时发生时，会互相造成影响，从而模糊单一故障的信息频率。

3.外界的震动：在真实的环境下，除了被检测的轴承，很可能还有其他震动进行干扰，而普通ML的抗噪能力不强。

4.故障的可观察性：有些故障出现的时候，不会产生单独的震动频率，有的故障对震动频率没有明显的影响，依靠震动频率作为检测主体的ML，对于轴承故障检测不够全面。

5.灵敏度：在不同的环境条件下，各故障类型的灵敏度也不一样，在真正投入使用之前，需要收集在不同环境下，各故障类型的灵敏度。

由于ML的难以解释，准确率不稳定，抗噪健壮性不强等特点，ML没有大量投入使用，并逐渐被后来的DL所取代。

基于深度学习的方法（DL）

DL是从ML发展而来的一个机器学习的子集。DL的出现可以主要归功于以下几个因素：

1.数据爆炸：DL学习需要大量的带标签数据，新一代的传感器能收集更多，更广泛的数据，而且得益于CWRU等公开数据集的出现，使得大量带标签数据的获取变得容易，这扩展了DL的输入，促进了DL的发展。（在小数据训练和测试中，DL和ML的性能相差并不大，但随着数据量的增加，二者的准确度也会逐渐区分开来）

2.算法优化：对于DL模型研究加深，能够更高效地训练网络，并达到更高的准确率，实现更快的速度、更好的收敛性。例如，ReLU等算法有助于加速收敛速度；dropout和池等技术有助于防止过拟合等。

3.硬件的进化：DL学习过程需要的计算量相当庞大，也就是学习时间长，导致效率低。高性能GPU的出现，可以显著加速这一训练过程。它强大的计算能力，极大地缩减了DL模型训练的时间，提高了工作效率。（例如，NVIDIA Tesla V100张量核心gpu现在可以比传统cpu更快地解析pb级数据）

DL的出现，迅速取代了传统的，繁琐的ML，相对于ML，DL有以下几个优势：

1.准确率更佳：虽然DL的计算函数比起ML要复杂得多，但DL在解决包括语音、语言、视觉、游戏等多个领域问题方面的表现明显优于ML。

2.自动特征提取：在ML中，特征提取这一环节需要人工实现，并且需要在该领域，拥有一定水平知识的专业人员。而DL中，我们只需要简单地把数据输入到模型中，模型就能自动的更改权重，实现特征自动提取和学习功能。这即减少了特征提取的人工成本，也提高了提取学习效率。

3.可转移性：ML往往是针对某一特殊情景具体制定的，而DL中的模型和技术通常具有通用性，例如，卷积神经网络、循环神经网络和长短期记忆。同一种技术，不需要作过多的改变，只需要更改参数和初始条件，模型就可以简单的转移到另一个领域中使用。

（1） Convolutional Neural Network (CNN)

分为输入层，隐藏层和输出层。低层隐藏层负责获取表面特征，高层隐藏层负责获取高级特征。

CNN擅长处理二维输入，因此在把数据输入到模型之前，需要将不同加速度计获取的一维时域原始数据叠加成二维矢量形式，再作为输入数据传输到模型中。

在CNN中，卷积和池化操作合称为一层，二维数据先通过卷积核卷积，再由池化函数过滤，最后通过一个激活函数（通常为ReLu或sigmoid）激发之后传给下一层。

CNN除了在故障检测中有良好的表现，在健康预测方面也有不错的效果，可以识别一些早期的不良症状和显性特征频率，如润滑退化（传统的ML很难检测出润滑退化这种相对隐形或早期故障特征）。

CNN变种：

1. an adaptive CNN (ADCNN)

最大的特点是能够自适应动态改变学习率。采用1个ADCNN的故障模式确定组件和3个ADCNNs的故障大小评估组件，以及具有最大池化的3层CNNs。

ADCNN在识别滚动元素缺陷和识别缺陷大小方面具有较好的准确性。

它在CNN传统结构的基础上，增加了错位层，相对于没加错位层的CNN，准确率从83.39%增加到了96.32%。

2.a CNN based on LeNet-5

基于LeNet-5的CNN，它包含2个交替卷积池层和2个全连接层。填充用来控制学习特征的大小，零填充用来防止尺寸损失。改进后的CNN架构能够提供更好的特征提取能力，测试集的准确率达到惊人的99.79%。而ADCNN只有98.1%，SVM为87.45%，ANN为67.70%。

3.a deep fully convolutional neural network(DFCNN)

数据在使用前先转换到光谱上，以便于后面的提取，采用了4层的卷积池化层。准确率达到了99.22%，带PSO的线性SVM只有94.28%，传统SVM为91.43%。

4.a multi-scale CNN(MS-DCNN)

为了节省CNN训练所需的时间，MS-DCNN使用了大小各不相同的卷积核来卷积，来提取不同大小的特征。

9层1-D CNN，2-D CNN，和MS-DCNN准确率分别为98.57%，95.25%，99.27%。在准确率有少量提高的同时，MS-DCNN的参数个数只有52172个，1-D CNN为171606，2-D CNN为213206。

抗噪能力，健壮性和时间复杂度，参数个数就像天平两端，很难实现二者兼得

5.Dempster-Shafer theory CNN(IDS-CNN)

IDS-CNN的提出，是为了克服不同负载对故障检测精准度的影响。功能的实现在于，IDS-CNN增加了一个基于基尼系数改进的距离矩阵。

6.LiftingNet

LiftingNet，是为了减少轴承速度变化对精准度的影响，它包括分离层，预测层，上升层，池化层和全连接层。用转速在1720到1797的CWRU数据集测试模型，准确率达到了99.63%。用区分度大的数据测试（转子的频率分别为10，20，30，40Hz），准确率为93.19%，比传统SVM算法准确率搞了14.38%。

7.Pythagorean spatial pyramid pooling（PSPP）

同样是减少轴承转速变化带来影响，通过测试已经可以在转子不同速率的运作下，保持高的准确率。

8.an adaptive overlapping CNN（AOCNN）

普通的CNN在数据输入前，需要先将采集的一维数据，重叠变为二维数据形式。而AOCNN，可以直接把采集的一维原始数据，直接作为输入。

它有一个重叠层，用于对原始振动数据进行采样，在自适应卷积层把原始数据分割为一段段的样本后，在当前层滤波器会对这些样本进行过滤，以获取当前的特征。

通过测试，AOCNN能在检测准确性保持在99.61%的基础上，把实际使用的数据压缩到5%到20%。

即简化了数据维度转化的过程，也降低了实际使用的数据量，减少了模型训练所需要的时间。

CNN的优势：

1.更好的抗噪能力和健壮性：CNN对于同种ANN，在信噪比较低的环境下，准确率增加了25%左右。

2.与传统的ANN相比，CNN几乎不需要神经元链接。

CNN的缺陷：

1.需要的层数往往较多，计算量较大

2.需要大量的已标注数据

有多种的CNN变种，在具体使用时，选择合适的CNN，例如数据量大，就选择能减少参数量，加快运算的CNN；所处环境信噪比较低，就选择抗噪能力强，健壮性强的CNN等。

（2）Auto-encoders

最初时，自编码器被作为ANN的一个非监督预训练方法使用。后来，自动编码器可以作为一种无监督的特征学习方法和一种贪婪的分层神经网络预训练方法使用。

它是一种以重构输入向量为目标的无监督学习方法，现在常用于作为特征提取或者数据降维功能使用。

它由ANN来训练，组成为一个编码器，一层隐藏层和一个解码器，编码器的输出作为解码器的输入。ANN取其原始输入和输出之间的均方误差作为损失函数，目的时通过解码器，还原编码器的输入数据。

ANN的使用：

1.extreme learning machine (ELM)

将自动编码器的自动特征提取能力与ELMs的高训练速度相结合，准确率达到了99.83%（其他传统的ML方法：SVM (WPD-SVM) (94.17%), EMD-SVM (82.83%), WPDELM (86.75%) and EMD-ELM (81.55%)）。且运算时间只需要其他方法的60%到70%。

2.stacked denoising auto-encoder (SDA)

和CNN相比，自动编码器的抗噪声能力不强，需要对它的构造作一些处理，以加强其抗噪能力和健壮性。

SDA由三个堆叠在一起的自动编码器组成。为了达到分类性能和训练速度的平衡，使用了三个隐藏层，分别为100、50和25单元。

用CWRU的15%噪声（人为噪声）比例的条件下，SDA的准确率达到了91.79%，比传统SAE的精准度提高了3%到10%。

3.a deep wavelet autoencoder (DWAE) with extreme learning machine (ELM)

将微波函数作为模型的激活函数，用微波自动编码器来进行有效的特征提取。

在此基础上，构造了一个具有多个WAE的DWAE来增强无监督特征学习能力，并采用ELM作为输出分类器。

最终检测准确率达到了95.20%，不仅超越了传统的ML方法（BPNN (85.43%) ，SVM (87.97%)，在DL算法里头，也是相当优秀的（the standard DAE with Softmax (89.70%) ，the standard DAE with ELM (89.93%)）

4. SAE-LCN (local connection network)

传统SAE的两个缺陷：

1.SAE倾向于提取相似或冗余的特征，这增加了模型的复杂性，而且准确性并没有提高。

2.所学习的特征可能具有位移变特性

为了解决这两个问题，SAE-LCN出现了。SAE-LCN由一个输入层，一个本地层，一个特征层，一个输出层组成。

具体来说，该方法在局部层从输入信号中局部学习特征，然后在特征层中获取位移不变特征，最后在输出层识别一个10类分类问题的轴承健康状况

准确率达到了99.92%，比起EMD, ensemble NN和其他的DL方法，高了1%到5%的准确率。

5.Gath-Geva (GG)

通过引入模糊最大似然估计(FMLE)来确定一个样本属于每个聚类的似然值。

使用8层SDAE从振动信号中提取有用特征，利用GG来识别不同类型的故障。

最差情况下的分类准确率为93.3%，比基于EMD的经典特征提取方案高出近10%。

AE的优势：

1.不需要已标注的数据

2.许多AE变种算法都拥有优秀的抗噪能力和健壮性

AE的缺陷：

1.需要预训练这一步骤

2.模型训练有可能会因错误的消失受到影响

（3） Deep Belief Network (DBN)

深度信念网络可以看作是简单的无监督网络的组合

子网络由一个输入层，一个隐藏层组成，每个子网络的隐藏层，作为下个子网络的输入层（在最上面的两层有无定向连接，允许无监督和监督的网络训练方法）

这种架构形成了快速的叠层间的非监督训练程序

它是一种相当高效的DL算法，在自然语言处理和药物探索方面已经得到重大关注，并于2017年首次用来进行故障诊断

该方法多用于给类型分类

DBN的使用：

1.SAE和DBN结合使用

采用了多传感器振动数据融合技术，把振动在时域和频域上的数据融合起来，使用两层SAE作特征提取，3层DBN作最终分类方法。

准确率达到了97.82%，完全超过了单纯的SAE架构

2.DBN-feed-forward neural network(FNN)

采用DBN作为特征提取方法，FNN作为RUL的预测。

数据的采集：两个垂直于轴的加速器安装在轴承外壳上，以102.4kHz的频率采样，持续两秒

实验证明，当轴承处于故障状态时，该方法的RUL预测相当准确

DBN的优势：

1.创新地提出了一种逐层贪婪学习策略来初始化网络

DBN的缺陷：

1.由于该方法需要两个阶段：初始化阶段和采样阶段，这导致计算代价提高，训练时间增长

（4）Recurrent Neural Network(RNN)

不同于前馈神经网络，RNN以一个循环的方式加工输入数据

每一个输入都会影响嵌套部分中的参数，因此过去的输入会通过改变嵌套参数的方式影响未来的输出

它是一种能够分析一维数据序列或时间数据流的神经网络，适用于输出依赖于以前计算的应用程序

但在模型训练学习中，因为嵌套过程很多，经常造成梯度爆炸，受此限制，RNN在一段时间内并没有得到很好的应用

后来新出现的LSTM架构，重新激活了RNN的应用

LSTM比起RNN，新增了一个“遗忘机制”，对于过去数据的参数影响，每次循环会通过一次权重判断，评判过去数据的影响是否还具有价值，有价值就保留，没有价值就将其遗忘。

因此LSTM克服了梯度爆炸的问题，且在记忆方面和建立时间数据依赖性上有很好的表现

RNN的使用：

1.RNN based health indicator(RNN-HI)

采集到的频域数据，通过related-similarity(RS)方法，计算当前数据初始数据点的数据相似度，根绝计算出的关联性和单调性进行数据特征提取，并将其作为RNN的输入

然后由RNN嵌套循环输入数据，输出数据，最终评估该轴承的RUL

实验证明该模型方法可行，而且性能优于基于SOM的方法

2.LSTM和一维CNN结合

该模型架构组成包括，一维CNN层，最大池化层，LSTM层，并最后采用softmax函数作为最终分类手段

通过实验，该架构的最优准确度达到了99.6%

3.a deep recurrent neural network (DRNN)

具有堆叠的递归隐藏层和LSTM单元

采用均方误差作为损失函数，并采用随机梯度下降法作为模型学习计算优化器

此外，还采用了自适应学习来提高训练性能

在1,750 rpm和1,797 rpm的测试集上，该模型方法的平均准确率分别为94.75%和96.53%

RNN的优势：

1.它是一个有历史记忆的网络，过去的参数和输入，能对未来的输出造成影响

2.能够建模时间依赖性

3.能够接收可变长度的输入：由于网络在理论上是可以无限循环的，它是一种嵌套的模式，因此可以接受可变长度的输入

RNN的缺陷：

1.由于梯度消失/爆炸导致的频繁学习问题：由于循环网络过于庞大，并且信息之间相关联度很高，在模型训练学习的时候，经常会出现数据计算量爆炸的情况

（5）Generative Adversarial Network (GAN)

该网络最初设计是为了生成模拟真实照片的图像，网络模型由一个生成器和一个鉴别器组成

生成器用于模拟给出的输入数据，生成一个“假的”数据信号；生成器的输出为一个加工假信号，一个原始真信号，将这两个信号传给鉴别器，作为鉴别器的输入；鉴别器需要学习分辨出两个数据信号，哪个是真正的原始数据，哪个是经过加工模拟的虚假数据

此处对抗就是指生成器和鉴别器的对抗，生成器需要学习精进“造假”的技术，不能让鉴别器识别出自己造出的信号为假；鉴别器则需要增强鉴别能力，精准鉴别出哪个是原始信号，哪个是加工的假信号

在普遍情况下，数据会显现出一种不平衡性，也就是大多数情况下，设备是健康良好的，只有极少数的时候，设备会呈现故障状态，这就导致了数据的不平衡。而GAN强大的数据生成能力，就能很好地解决这种情况，经过训练，最终生成平衡地数据

通常应用于标签数据稀缺应用程序中的数据扩充（平衡数据），或以半监督的方式应用于分类问题

GAN的使用：

1.deep convolution GAN (DCGAN) with imbalanced dataset

生成器和鉴别器各由4层卷积层组成，使用的数据集是原始且不平衡的振动数据

经过DCGAN网络对抗学习，最终得到一个数据平衡的数据集。将处理过数据集作为输入传输给SVM来进行故障诊断分类

实验证明，DCGAN平衡数据的效果，比其他方法更优秀，包括随机过采样、随机欠采样和合成少数过采样技术

2.categorical adversarial autoencoder(CatAAE)

该方法主要依靠GAN强大的数据生成能力和数据分类鉴别能力，通过对抗性的训练过程来训练编码器

经过在不同信噪比环境下测试，CatAAE的性能要优于K均值算法

GAN的优势：

1.使用方便，在转移该技术模型到不同领域时，几乎不用做任何修改

2.不会引入确定性偏差

3.训练不需要蒙特卡洛近似

4.不一定需要已标注的数据训练，网络可以根据数据中的规律，推断出数据的类型

GAN的缺陷：

1.训练是不稳定的，它需要找到一场比赛的纳什均衡

2.很难学会生成离散数据，比如文本

（6）Deep Learning based Transfer Learning

ML和DL模型训练，经常需要大量的已标注数据，但在实际情况下，这样的数据却很难得到，主要有三个方面的困难：

1.要获得故障数据，必然要让机器在故障的情况下，继续运行，而这可能会造成较为严重的后果

2.无法确定机器要花费多久才会故障，在机器故障，获取数据之前，可能会需要耗费大量的时间

3.操作条件以及环境的差异都会造成数据的大幅度变化，很难获得不同条件环境下的大规模数据

当前大多共享使用的数据都是在实验里获取的，这导致数据往往缺少真实性，很多在实验室数据中准确率很高的模型方法，一到真实环境下，就变得乏力

因此需要一种迁移研究，收集数据中不变的根本特性，把在实验室数据中获取的数据特征，迁移到真实环境中去

迁移学习的使用：

1.domain adaptation

域适应方法通过探索领域不变特征，建立了从源领域到目标领域的知识转移，它利用源域的标记数据和目标域的未标记数据，减小两个域之间的分布差异

将域适应方法和当前已有的优异DL方法结合起来，就能在保持非凡的自动特征学习能力的同时赋予了领域迁移能力

2.WDCNN和AdaBN结合

WDCNN的第一层卷积层中，用到了大小对64X64的大卷积核，有强大的抗频域噪声能力

WDCNN提取目标域信号的均值和方差，作为输入信号传输给AdaBN，以实现域适应

实验测试时，用CWRU数据集中的一种操作情况下的数据训练WDCNN，而用另一种情况下的数据测试验证它的分析检测能力。实验结果得到，该模型平均的准确率达到了95.9%，超过了FFT-DNN方法（78.1%）

（7）一些其他方法

1.Variational Autoencoders

它使用变分推断来生成数据的潜在表示形式，然后对潜在变量和数据本身强加一个分布

该方法拥有数据降维的能力，它能从高维数据中提取特征，从而生成一个相关度高，有效性强的低维数据

研究实验证明，该方法的降维能力和期望已经超过了PCA方法

2.Capsule Neural Networks

它具有较强的通过胶囊模块识别特征位置和方位关系的能力，同时，该模型结构相对简单，参数较少，显著提高了其泛化能力

3.Siamese Neural Networks

该模型设计用于将签名验证作为图像匹配问题来解决

实际使用时，需要将相同或不同类别的样本对纳入其中，模型通过测量两个特征向量输出的距离来确定它们的相似性

由于签名认证，成功失败都是一次性的，因此该方法主要钻研一次性检测能力，而不是多次检测准确率

用于故障轴承诊断的深度学习算法讨论

1.自动提取特征和自动学习

在ML中，特征的提取需要人工操作，并且要求该人员拥有特定领域的专业知识，这导致ML算法在实际使用中所花费的时间成本和人力成本过高

DL算法对比ML算法，除了准确率大量提升以外，最重要的进步，是特征提取和学习自动化

DL自动化即降低了实验的成本，也加速了实验的进程和模型的性能

2.准确率不能作为判断模型性能的唯一指标

准确率一直是判断模型性能的首要指标，但在实际应用中，单指标判断方法很多时候显得片面。有多个现实原因和要求，证明不能只用准确率作为判断模型性能的唯一指标

（1）模型应用范围要广

有些DL模型在某个特定环境下的准确率能达到99%，但一旦实验条件改变，信噪比发生变化，准确率就会大幅度下滑。在实际使用中，环境是多变的，考察一个模型性能的时候，判断它在多个环境下，是否还能保持高准确度非常重要

（2）不平衡采样

在数据采集的过程中，设备故障的情况是极少的，更多时候设备处于健康状态，这就导致了样本数据的严重不平衡，健康数据和故障数据的比例远远达不到1：1。应该引入其他指标，如精度、召回率和f1评分，以提供更多的细节来评估故障识别网络的可靠性

此外，由于采样数据有限，采集的数据不一定能包含实际设备故障的全部或者大部分特征。在这种情况下，只使用准确率这单一指标就显得有些不妥。

（3）数据随机性

不同的模型方法，使用的数据集不同，提取的数据特征特点不同，数据集所处环境也不同。就算是用的同一个数据集，其中用来学习和测试验证性能的具体数据，数据量大小和比例都不一样。

条件不同，实验得出的性能肯定有差异，这时就需要更多方面的性能指标去阐述模型的性能

（4）准确性饱和

现有的大多算法，基本上在各自的数据集上，准确度都能达到95%以上。如果只看准确度，很难区分出多个算法之间的性能差异。并且在实验室采取的，或者人工造成设备故障的数据，有个通用的毛病是数据不够真实。在这种数据下达到的高准确率模型，在实际的应用中不一定能够保持好的性能，要考察一个模型的性能，还需要测试该模型是否能在多个环境下保持高的准确率。

算法选择的建议，遇到的挑战以及未来前进的方向

1.算法选择的建议

（1）根据环境选择

在室内，噪音较小，简单的ML算法就足够了，有较好的准确率，并且效率高

如果是在室外，或者噪音比较多，就要用DL算法，DL比起ML算法，有更好的抗噪能力

（2）根据传感器选择

CNN善于处理二维的数据，如果要使用CNN，那就要用两个垂直的传感器采集数据

反过来也一样，如果现场即能测量设备振动信号，又能测量设备温度，那就可以选择能处理多物理特性的网络，最大限度地完整利用数据

（3）根据数据选择

如果数据量较小，可以考虑使用ML即可

数据量较大，就用DL算法，充分利用大数据的优势，提高算法性能和整体准确率

数据不平衡的情况，可以使用GAN网络进行数据的扩充，数据平衡之后，再把数据作为神经网络的输入进行学习

2.遇到的挑战

（1）知识特征迁移

现有的数据有很多是在实验室获取的，有些甚至是人工造成的故障，与真实的环境相差甚远。因此需要知识迁移，把实验室中提取到的特征，训练好的模型，迁移到现实数据中，实现模型的泛用

（2）有限的被标注数据

有标注的数据在当前环境中是少数，更多的时候，是直接采集的一大堆没有标注的原始数据。逐个给数据标注实在是太费时间和成本，而且就算人工标注，也很难判断某个轴承在当前时刻有怎么样的损坏，属于哪一个类别，这就需要模型要有给未标注数据分类，直接处理未标注数据的能力

（3）数据不平衡

设备多数情况下是健康良好的，只有极少数情况下才处于故障状态，因此健康数据和故障数据的比例是严重不平衡的。这时需要采用类似GAN的算法，对原始数据进行模仿填充，把不平衡数据填充为平衡数据

（4）噪声数据

在真实的情况环境下，采集的数据除了被测轴承的振动外，还会有各式的噪声混杂在一起。进行学习的模型必须要具有抗噪能力才能精准地获得真正地数据

3.未来方向

（1）迁移学习

把在实验室数据中训练得到的数据特征，转移到现实情况中，实现同一个模型可以在实验室中训练，在现实条件下测试检验使用

（2）半监督学习

当前标记数据有限，半监督学习可以充分利用有限的标记数据和大量的无标签数据

（3）数据扩充

使用类GAN的方法，对少量的或者不平衡的数据进行扩充，得到比例平衡的大量数据

（4）小样本学习

另一种解决数据不足的问题，更快更效率地对少量数据进行学习

（5）可解释性

对已有的模型的原理进行更好的解释，增强模型的可改写性

（6）传感器融合

部署多种类型的传感器，如测压元件、电流传感器、声发射传感器等，通过对数据地多方面检测，获取数据地在不同领域地多个特征，充分利用数据的同时，也缓解了噪声对数据的影响

你可能感兴趣的:(深度学习)

AlphaFold2的思路总结（十五） xiaofengzihhh 蛋白质结构预测深度学习人工智能神经网络
2021SC@SDUSC这学期的代码分析工作接近尾声了，我想简单总结一下AlphaFold2的总体思路具体来看，AlphaFold2主要利用多序列比对（MSA），把蛋白质的结构和生物信息整合到了深度学习算法中。它主要包括两个部分：神经网络EvoFormer和结构模块（Structuremodule）。一、EvoFormer 在EvoFormer中，主要是将图网络（Graphnetworks）
python机器学习方安乐 python python 机器学习人工智能
Python机器学习是当前最为热门的机器学习领域之一，其简洁、易用、高效的特点，让越来越多的开发者开始探索其应用。本文将从以下几个方面介绍Python机器学习的基础知识和实践案例，帮助读者更好地理解和应用机器学习技术。前提Python机器学习的应用领域A.图像识别和计算机视觉B.自然语言处理和文本分析C.数据挖掘和推荐系统深度学习A.神经网络的基本原理B.常用的深度学习框架和算法C.深度学习在图像
基于深度学习的舆论分析与检测系统应用与研究计算机软件程序设计机器学习深度学习人工智能舆论检测
【1】系统介绍研究背景随着互联网技术的迅猛发展和社会媒体平台的普及，信息传播的速度和范围达到了前所未有的水平。这一变化不仅极大地丰富了人们的社交生活，也为社会科学研究提供了新的视角和工具。舆论分析作为社会科学研究的一个重要分支，其目的是通过收集和分析网络上的公众意见和情感倾向，来了解人们对特定事件或话题的看法和态度。近年来，基于深度学习的自然语言处理技术取得了显著进步，这为提高舆论分析的准确性和效
深度学习利用数据加载、预处理和增强数据提高模型的性能 weixin_30777913 人工智能深度学习
深度学习数据预处理是一个关键步骤，旨在提高模型的性能和准确性。通过数据加载、预处理和增强，可以显著提高深度学习模型的性能和准确性。在实际应用中，需要根据具体的数据和任务来选择合适的预处理和增强技术。以下将详细论述并举例说明如何加载、预处理和增强数据。一、数据加载在深度学习中，数据加载是第一步。这通常涉及到从各种数据源（如CSV文件、数据库、图像文件夹等）中读取数据。以DeepLearning4J（
【深度学习】搭建PyTorch神经网络进行气温预测睡不着还睡不醒深度学习深度学习 pytorch 神经网络
第一步数据加载与观察①导包importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimporttorchimporttorch.optimasoptimimportwarningswarnings.filterwarnings("ignore")%matplotlibinline②加载数据features=pd.read_csv("te
深度学习-97-大语言模型LLM之基于langchain的实体记忆和知识图谱记忆皮皮冰燃深度学习深度学习语言模型 langchain
文章目录1内存记忆Memory1.1记忆系统支持的操作1.2记忆的存储1.3记忆的查询2记忆的应用2.1设置环境变量2.2ConversationEntityMemory实体记忆2.3ConversationKGMemory知识图谱记忆2.3.1创建ConversationKGMemory2.3.2创建ConversationChain2.4ConversationBufferWindowMemo
PyTorch 实战教程：从模型搭建到训练的每一步 AI_小站 pytorch 人工智能 python transformer 深度学习大模型 LLM
用深度学习搞事情，模型搭建和训练是绕不开的两步。而PyTorch，作为一个“又灵活又好用”的深度学习框架，简直就是写代码的快乐源泉。今天我们就从0到1，实战PyTorch的模型搭建和训练流程。说白了，看完你就能自己搭个神经网络，喂点数据进去，再让它干点活。安装PyTorch要用PyTorch，得先装上它。PyTorch的安装稍微有点讲究，主要是要根据你的硬件选择CPU版本还是GPU版本。基本安装命
计算机视觉：卷积核每天五分钟玩转人工智能计算机视觉计算机视觉深度学习人工智能机器学习卷积神经网络
本文重点卷积神经网络（ConvolutionalNeuralNetwork，CNN）是一种深度学习模型，广泛应用于图像识别、自然语言处理、语音识别等领域。在卷积神经网络中，卷积核是网络的核心组件之一。通过不断堆叠卷积层和池化层，可以逐渐提取出更高级别的特征，从而实现更复杂的任务。卷积神经网络中的卷积核可以通过反向传播算法进行训练和优化，使其能够自适应地学习输入数据中的特征。因此，卷积神经网络在图像
浅谈人群扩展（lookalike）模型 eso1983 算法
Lookalike主要用于广告或者推荐系统中，找到与种子用户相似的人群。常用的算法应该包括协同过滤、基于标签的相似度计算，还有一些机器学习模型，比如逻辑回归、随机森林，以及深度学习的模型，比如DNN或者Embedding方法。这里简单介绍一下Lookalike人群扩展（相似人群扩展）中常用算法模型的解析，涵盖原理、数学公式、实现步骤、优缺点及适用场景。1.基于标签的相似度匹配原理通过用户标签（兴趣
【深度学习】常见模型-生成对抗网络（Generative Adversarial Network, GAN） IT古董人工智能深度学习机器学习深度学习生成对抗网络人工智能
生成对抗网络（GenerativeAdversarialNetwork,GAN）是一种深度学习模型框架，由IanGoodfellow等人在2014年提出。GAN由生成器（Generator）和判别器（Discriminator）两个对抗网络组成，通过彼此博弈的方式训练，从而生成与真实数据分布极为相似的高质量数据。GAN在图像生成、文本生成、数据增强等领域中有广泛应用。核心思想GAN的核心是两个神经
InceptionV1实现猴痘病识别案例小叮当爱咖啡计算机视觉人工智能神经网络深度学习
本文为为365天深度学习训练营内部文章原作者：K同学啊InceptionModule是InceptionV1的核心组成单元，提出了卷积层的并行结构，实现了在同一层就可以提取不同的特征为了改善计算量大的问题，使用了1*1的卷积核实现降维操作，以此来减小网络的参数量与计算量1*1卷积核的作用：降低输入特征图的通道数，减小网络的参数量与计算量最后InceptionModule基本由1*1卷积，3*3卷积
Python 深度学习实战：生成对抗网络 AI天才研究院深度学习实战 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍生成对抗网络（GenerativeAdversarialNetwork，GAN）是近年来较火热的深度学习模型之一，其在图像合成、视频生成、文本数据生成等领域均取得了不俗的效果。与传统的机器学习模型不同，GAN可以生成真实有效的数据，无需人工标注数据。它由两部分组成：生成器（Generator）和判别器（Discriminator）。生成器通过学习，根据噪声或随机变量（latentvar
【深度学习】常见模型-卷积神经网络（Convolutional Neural Networks, CNN） IT古董人工智能深度学习机器学习深度学习 cnn 人工智能
卷积神经网络（CNN）概念简介卷积神经网络（ConvolutionalNeuralNetworks,CNN）是一种专门用于处理数据具有网格状拓扑结构（如图像、语音）的深度学习模型。它通过卷积操作从输入数据中提取局部特征，并逐层构建更复杂的特征表示，广泛应用于图像分类、目标检测、语音识别等领域。关键组成部分卷积层（ConvolutionalLayer）使用卷积核（滤波器）在输入上滑动，提取局部特征。
NVIDIA L40s、A10、A40、A100、A6000横评，哪个GPU 更适合 AI 推理任务？ DO_Community 技术科普商业建议人工智能 gpu算力 DigitalOcean ai AIGC
近年来，随着人工智能技术的发展，特别是深度学习模型的广泛应用，GPU（图形处理单元）作为加速计算的重要硬件，在AI领域扮演着越来越重要的角色。AI推理是指已经训练好的模型对新数据进行预测的过程。与训练阶段相比，推理通常对GPU的要求有所不同，更注重于能效比、延迟以及并发处理能力。本文将从这些角度出发，对比分析NVIDIA的L40s、A10、A40、A100、A6000五款GPU在AI推理任务中的表
国内的AI大模型有可能超过ChatGPT吗？ AIWritePaper官方账号 Prompt ChatGPT AIWritePaper chatgpt 人工智能深度学习 AI写作 AIGC
这是一个非常有前瞻性和现实意义的问题。要回答国内AI是否有可能超过ChatGPT，我们需要从多个方面来分析，包括技术基础、数据资源、应用场景、政策支持以及人才储备等。以下是对这一问题的详细探讨：1.技术基础（1）现状国内AI技术：国内的AI技术发展迅速，尤其在深度学习、自然语言处理（NLP）和计算机视觉等领域已经取得了显著进展。例如，百度的文心一言、阿里的通义千问等大语言模型（LLM）已经在技术上
WGAN - 瓦萨斯坦生成对抗网络池央生成对抗网络人工智能神经网络
1.背景与问题生成对抗网络（GenerativeAdversarialNetworks,GANs）是由IanGoodfellow等人于2014年提出的一种深度学习模型。它包括两个主要部分：生成器（Generator）和判别器（Discriminator），两者通过对抗训练的方式，彼此不断改进，生成器的目标是生成尽可能“真实”的数据，而判别器的目标是区分生成的数据和真实数据。虽然传统GAN在多个领域
InternLM: LMDeploy 量化部署进阶实践 dilvx 机器学习
LMDeploy部署模型模型部署是将训练好的深度学习模型在特定环境中运行。欢迎使用LMDeploy，支持市面上主流的格式和算法。大模型缓存推理本章的前半部分主要讲量化，包括KV-Cache量化、权重量化、激活值量化。量化主要是为了节省存储空间，用int4,int8来重新表示fp16，将模型的显存占用控制在200G可接受的范围下。值得注意的是，在transformer架构下，计算的瓶颈主要在显存带宽
NVIDIA-TensorRT-Python推理呆呆珝推理框架 python 人工智能开发语言
1,前言NVIDIATensorRT进行模型推理的Python实现。TensorRT是一个高性能的深度学习推理优化器和运行时，它能够为深度学习模型提供低延迟和高吞吐量的推理能力。(由于官方文档的使用还是比较简单，也可能自己很菜，参考了别人的文档和自己摸索，写出来这个可以使用的API)2.Python-API推理step1：导入基本库(环境自行配置)#导入TensorRT库importtensorr
NCNN推理呆呆珝推理框架 c++人工智能
1.前言ncnn是一个高性能的神经网络前向计算框架，专门针对移动设备和嵌入式设备设计。它由腾讯优图实验室开发，旨在提供高效的神经网络推理能力，特别是在资源受限的环境中，如智能手机和嵌入式系统。ncnn被广泛应用于移动端和嵌入式设备上的各种深度学习应用，包括但不限于：图像分类/目标检测/语义分割/人脸识别/图像生成与处理2.NCNN的CMakeLists.txt编写ncnn的头文件，链接文件，静态链
基于深度学习的鸟类识别系统详解（UI界面 + YOLOv10 + 数据集） 2025年数学建模美赛深度学习 ui YOLO 人工智能 python 计算机视觉
引言鸟类识别是计算机视觉领域中一个独具挑战性的任务，尤其是在复杂的自然环境中，识别不同种类的鸟类需要非常强大的模型和丰富的数据集。随着深度学习技术的发展，基于YOLO（YouOnlyLookOnce）系列模型的目标检测系统展现了卓越的性能，特别是在速度和精度上的平衡方面。本博客将详细讲解如何利用YOLOv10模型来构建一个基于深度学习的鸟类识别系统。该系统会结合自定义鸟类数据集，设计一个简洁直观的
智源社区AI周刊：Hinton预测破解大脑机制时间；Gary Marcus批判追捧深度学习风潮；谷歌发布Imagen... 智源社区机器学习人工智能深度学习编程语言大数据
汇聚每周必看AI观点、研究和各类资源，不错过一条重要资讯！欢迎扫码订阅，获取邮件推送。观点“我们会在未来的五年内破解这些（人脑的）程序......现有的一切人工智能，都是建立在与大脑高层次上所做的事情完全不同的基础上......假设有数十亿的参数，这些神经元间的权重在大量训练实例的基础上去调整，会发生奇妙的事情。大脑是如此，深度学习也是如此。但问题在于，如何获得调整参数的梯度......目前我的信
想转行到人工智能领域，我该学什么，怎么学？张登杰踩人工智能 python
转行到人工智能（AI）领域需要系统的学习和实践，以下是详细的路径建议，涵盖基础知识、技能学习、项目实践和求职准备：一、明确目标和领域方向人工智能领域广泛，建议先了解细分方向（如机器学习、深度学习、计算机视觉、自然语言处理、强化学习等），结合兴趣和职业规划选择切入点。二、构建基础知识1.数学基础线性代数：矩阵运算、特征值、向量空间。微积分：导数、梯度、优化理论。概率与统计：贝叶斯定理、分布、假设检验
深度学习-94-大语言模型LLM之基于langchain的链Chain的基础应用和调用方式皮皮冰燃深度学习深度学习语言模型 langchain
文章目录1Chain链的分类1.1LCELChains(链构造器)1.2LegacyChains(遗留链)2链的基础应用2.1OllamaLLM2.2是否使用chain的对比2.2.1不使用Chain2.2.2使用Chain3链的调用方式3.1通过invoke方法【推荐】3.2通过predict方法3.3通过apply方法3.4通过generate方法4参考附录1Chain链的分类为开发更复杂的应
Swin-Unet：图像分割领域的强大工具陈凯韵
Swin-Unet：图像分割领域的强大工具【下载地址】Swin-UnetPyTorch代码仓库本仓库提供了一个基于PyTorch实现的Swin-Unet模型的代码资源。Swin-Unet是一种结合了SwinTransformer和U-Net结构的深度学习模型，适用于图像分割任务。该代码可以帮助研究人员和开发者快速上手并应用Swin-Unet模型进行图像分割实验项目地址:https://gitcod
新质生产力与核心竞争力提升 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
新质生产力、人工智能、机器学习、深度学习、算法优化、数据驱动、核心竞争力、数字化转型1.背景介绍在当今数字化时代，科技创新正以惊人的速度推动着社会发展。人工智能（AI）作为科技发展的重要驱动力，正在深刻地改变着生产方式和生活方式。从自动驾驶汽车到智能语音助手，从个性化推荐系统到医疗诊断辅助，AI技术的应用场景日益广泛，为人类社会带来了前所未有的机遇。然而，AI技术的应用并非一帆风顺。如何有效地利用
李开复：苹果发布AI应用的未来 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
苹果,AI,应用,未来,深度学习,自然语言处理,计算机视觉1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，并开始渗透到人们生活的方方面面。从智能手机的语音助手到自动驾驶汽车，AI正在改变着我们的世界。作为科技巨头，苹果也积极布局AI领域，并将其融入到其产品和服务中。2017年，苹果发布了其首款AI芯片A11Bionic，并将其应用于iPhoneX等产品。该芯片拥有强大的神经网络处理能力，为
推荐系统的未来发展方向：大模型的主流化 AI天才研究院计算大数据AI人工智能 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《推荐系统的未来发展方向：大模型的主流化》关键词：推荐系统，大模型，深度学习，人工智能，未来趋势摘要：本文深入探讨了推荐系统的发展历程及其在当前人工智能时代的重要性。重点分析了深度学习在大模型中的应用，探讨了大模型的主流化趋势及其面临的挑战。通过案例研究，展示了大模型在实际推荐系统中的应用效果，并对未来的发展方向进行了展望。目录大纲推荐系统的概述1.1推荐系统的发展历程1.2推荐系统的基本架构深度
自动驾驶中的虚实迁移学习:降低对真实世界数据的依赖 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
自动驾驶,迁移学习,虚实环境,数据效率,深度学习,强化学习1.背景介绍自动驾驶技术作为人工智能领域的重要应用之一，其发展离不开海量真实世界驾驶数据。然而，收集和标注真实世界驾驶数据成本高昂，且存在安全隐患。因此，如何降低对真实世界数据的依赖，提高自动驾驶系统的训练效率和安全性，成为一个亟待解决的关键问题。虚实迁移学习(Virtual-to-RealTransferLearning)作为一种新兴的机
详细介绍 NVIDIA GeForce RTX 系列，各显卡配置参数（长期更新 - 2024.12） JiaWen技术圈人工智能深度学习机器学习 gpu算力 AIGC 人工智能图形渲染
NVIDIAGeForceRTX系列是NVIDIA面向消费级市场的高性能GPU产品线，注重提供高性能的图形处理能力和游戏特性。主要面向游戏玩家和普通用户，同时也被广泛用于深度学习推理和训练等计算密集型任务。主要GPU产品有：50Series、40Series、30Series、20Series、10Series。其主要参数如下：NVIDIAGeForceRTX50Series规格架构：Blackw
自动检测和机器审核系统实现 ╰つ゛木槿 java easyui javascript python java 自然语言处理
目录一、自动检测和机器审核实现步骤1.文本预处理步骤细节：2.关键词检测步骤细节：3.情感分析与情境理解步骤细节：4.机器学习模型训练步骤细节：5.深度学习模型步骤细节：6.多模态审查步骤细节：7.用户行为分析与违规预测步骤细节：总结二、常用的分词工具1.jieba2.THULAC3.HanLP4.SnowNLP5.LAC（LexicalAnalysisofChinese）6.PyLDAvis（结
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =