保姆级教程之SABO-VMD-SVM的西储大学轴承诊断

之前写过一篇优化核极限学习机的轴承诊断,今天再出一期基于SVM的轴承诊断。

依旧是包含了从数据处理,到减法优化器SABO算法优化VMD参数,再到支持向量机的故障诊断,实现故障诊断的全流程,其他类型的故障诊断均可参考此流程。数据替换十分简单!

友情提示:对于刚接触故障诊断的新手来说,这篇文章信息量可能有点大,大家可以收藏反复阅读。即便有些内容本篇文章没讲出来,但其中的一些跳转链接,也完全把故障诊断这个故事讲清楚了。

与上一期文章相似,先给大家看看文件夹目录,都是作者精心整理过的。

保姆级教程之SABO-VMD-SVM的西储大学轴承诊断_第1张图片

最后一个压缩包是有关VMD画图的程序。考虑到大家可能会用到VMD的相关作图,包络谱,频谱图等,作者在这里也一并附在代码中了。这部分大家需要自行更改数据!也就是作者比较火的文章之一,这里边提到的所有代码:VMD分解,matlab代码,包络线,包络谱,中心频率,峭度值,能量熵,样本熵,模糊熵,排列熵,多尺度排列熵,西储大学数据集为例

如图所示,本次内容一共做了三件事情:

一,对官方下载的西储大学数据进行处理,步骤如下:

1.一共加载10种数据,然后取每个数据的DE_time(%DE是驱动端数据 FE是风扇端数据 BA是加速度数据 选择其中一个就行)

2.设置滑动窗口w,每个数据的故障样本点个数s,每个故障类型的样本量m

3.将所有的数据滑窗完毕之后,综合到一个data变量中

有关西储大学数据的处理之前有文章也讲过,大家可以看这篇文章:西储大学轴承诊断数据处理,matlab免费代码获取

图中的1750,1772,1790是西储大学轴承的转速,大家做诊断的时候,选择其中一个即可,即选同一转速下的不同故障进行诊断更有意义!

二,对第一步数据处理得到的数据进行特征提取

选取五种适应度函数进行优化,这里大家可以自行决定选哪一个!以此确定VMD的最佳k和α参数。五种适应度函数分别是:最小包络熵,最小样本熵,最小信息熵,最小排列熵,排列熵/互信息熵,代码中可以一键切换。至于应该选择哪种作为自己的适应度函数,大家可以看这篇文章。VMD为什么需要进行参数优化,最小包络熵/样本熵/排列熵/信息熵,适应度函数到底该选哪个

老粉应该知道,之前也推过一篇文章,就是关于西储大学特征提取的,但当时作者懒,没有写一个大循环,需要大家针对每种类型的数据依次提取。这次,作者把特征提取写了一个大循环,方便一键特征提取,大家也可以很简单的更换自己的数据!

至于特征提取的具体原理,也在这篇文章进行过详细介绍,大家可以跳转阅读。简单来说,就是利用包络熵最小的准则把每个样本的最佳IMF分量提取出来,然后对其9个指标进行计算,分别是:均值,方差,峰值,峭度,有效值,峰值因子,脉冲因子,波形因子,裕度因子。然后用这9个指标构建每个样本的特征向量。

另外本篇文章采用了2023年一个较新且效率较高的智能算法---减法优化器(SABO),对VMD参数进行了优化,找到了每个故障类型的最佳IMF分量,并利用包络熵最小的准则,提取出了最佳的IMF分量。

三,采用支持向量机实现故障分类

本文所选SVM是从官网下载的libsvm-3.3版本,作者已编译好,大家可以直接运行。如果想自行编译的童鞋可以从网站下载:https://www.csie.ntu.edu.tw/~cjlin/libsvm/index.html,编译步骤可以参考https://blog.csdn.net/qq_42457960/article/details/109275227

本文采用了网格搜索机制,并采用5折交叉验证,对SVM的惩罚因子c和gamma参数进行寻优。

结果展示

保姆级教程之SABO-VMD-SVM的西储大学轴承诊断_第2张图片

混淆矩阵图,有的文章会采用这种图:

保姆级教程之SABO-VMD-SVM的西储大学轴承诊断_第3张图片

这里不得不说一句,官方给出的libSVM包,准确率就是嘎嘎高!

部分代码

数据处理代码:

clc;
clear;
addpath(genpath(pwd));
%DE是驱动端数据 FE是风扇端数据 BA是加速度数据 选择其中一个就行
load 97.mat     %正常
load 107.mat    %直径0.007英寸,转速为1750时的  内圈故障
load 120.mat    %直径0.007,转速为1750时的  滚动体故障
load 132.mat    %直径0.007,转速为1750时的  外圈故障
load 171.mat    %直径0.014英寸,转速为1750时的  内圈故障
load 187.mat    %直径0.014英寸,转速为1750时的  滚动体故障
load 199.mat    %直径0.014英寸,转速为1750时的  外圈故障
load 211.mat   %直径0.021英寸,转速为1750时的  内圈故障
load 224.mat  %直径0.021英寸,转速为1750时的  滚动体故障
load 236.mat  %直径0.021英寸,转速为1750时的 外圈故障
w=1000;                  % w是滑动窗口的大小1000
s=2048;                  % 每个故障表示有2048个故障点
m = 10;  %每种故障有120个样本
D0=[];
for i =1:m
    D0 = [D0,X097_DE_time(1+w*(i-1):w*(i-1)+s)];
end
D0 = D0';

SABO优化VMD参数并特征提取的代码:

%%  此程序运行需要很长的时间!!
% vmddata.mat就是最终特征提取的结果!


%% 以最小包络熵、最小样本熵、最小信息熵、最小排列熵,排列熵/互信息熵,为目标函数(任选其一),采用SABO算法优化VMD,求取VMD最佳的两个参数
clear
clc
close all
addpath(genpath(pwd))
xz = 5;  %xz, 选择1,以最小包络熵为适应度函数,
% 选择2,以最小样本熵为适应度函数,
% 选择3,以最小信息熵为适应度函数,
% 选择4,以最小排列熵为适应度函数,
% 选择5,以复合指标:排列熵/互信息熵为适应度函数。
if xz == 1  
    fobj=@EnvelopeEntropyCost;          %最小包络熵
elseif xz == 2
    fobj=@SampleEntropyCost;            %最小样本熵
elseif xz == 3  
    fobj=@infoEntropyCost;              %最小信息熵
elseif xz == 4
    fobj=@PermutationEntropyCost;       %最小排列熵
elseif xz == 5
    fobj=@compositeEntropyCost;       %复合指标:排列熵/互信息熵
end
load data_total_1797.mat   %这里选取转速为1797的10种故障,大家也可以选取其他类型的数据
D=2;             % 优化变量数目
lb=[100 3];      % 下限值,分别是a,k
ub=[2500 10];        % 上限值
T=20;       % 最大迭代数目
N=15;        % 种群规模
vmddata = [];
for i=1:10   %因为有十种故障状态
    disp(['正在对第',num2str(i),'个故障类型的数据进行VMD优化……请耐心等待!'])
    every_data = data(1+120*(i-1):120*i,:);  %一种状态是120个样本,每次选120个样本进行VMD优化和特征提取
    da = every_data(1,:);  %从当前状态的数据中任选一组数据进行VMD优化即可。
    [SABOBest_score,SABOBest_pos,Bestidx,SABO_curve] = SABO(N,T,lb,ub,D,fobj,da');
    display(['第',num2str(i),'个故障类型数据的最佳VMD参数是:', num2str(fix(SABOBest_pos)),'最佳IMF分量是:IMF',num2str(Bestidx)]);  %输出最佳位置
    %% 以下为将最佳的a,k,idx回带VMD中,并进行9种时域指标特征提取
    bbh = fix(SABOBest_pos);%最佳位置取整
    new_data = tezhengtiqu(bbh(1),bbh(2),Bestidx,every_data);  %将优化得到的两个参数和最小适应度的索引值带回VMD中,提取得到当前状态的特征向量
    vmddata =  [vmddata;new_data];  %将每个状态提取得到的特征向量都放在一起
end
    save vmddata.mat vmddata  %将提取的特征向量保存为mat文件
%% 删除路径,以免被其他函数混淆
rmpath(genpath(pwd))

SVM诊断的代码:

%% 初始化
clear
close all
clc
warning off
% 数据读取
addpath(genpath(pwd));
load vmddata.mat  %加载处理好的特征数据
data = vmddata;
% 数据载入


bv = 120;    %每种状态数据有120组
% 加标签值
hhh = size(data,2);
for i=1:size(data,1)/bv
    data(1+bv*(i-1):bv*i,hhh+1)=i;
end
input=data(:,1:hhh);
output =data(:,end);
jg = bv;   %每组120个样本
tn = 90;    %选前tn个样本进行训练
input_train = []; output_train = [];
input_test = []; output_test = [];
for i = 1:max(data(:,end))
    input_train=[input_train;input(1+jg*(i-1):jg*(i-1)+tn,:)];
    output_train=[output_train;output(1+jg*(i-1):jg*(i-1)+tn,:)];
    input_test=[input_test;input(jg*(i-1)+tn+1:i*jg,:)];
    output_test=[output_test;output(jg*(i-1)+tn+1:i*jg,:)];
end
input_train = input_train'; 
input_test = input_test';
%归一化
[inputn_train,inputps]=mapminmax(input_train);inputn_train = inputn_train';
[inputn_test,inputtestps]=mapminmax('apply',input_test,inputps); inputn_test =inputn_test';
[c,g] = meshgrid(-10:0.5:10,-10:0.5:10);  %调整间距,可以搜索的更加精细
[m,n] = size(c);
cg = zeros(m,n);
eps = 10^(-4);
v = 5;  %采用5折交叉验证
bestacc = 0;

代码获取

完整代码获取,点击下方卡片,后台回复关键词:

SVM诊断

你可能感兴趣的:(支持向量机,算法,机器学习,人工智能,数据挖掘)