灰色关联分析

概念

灰色关联是一种可以用来进行系统分析(也就是确定哪个因素对最终结果影响最大)的方法。
灰色关联分析的基本思想是根据序列曲线集合形状的相似程度来判断其联系是否紧密。曲线越接近,相应序列之间的关联度就越大,反之则越小。

应用

1.进行系统分析
例:
灰色关联分析_第1张图片

求解步骤:
第一步:画统计图
灰色关联分析_第2张图片
画图后再配上简单的分析:
<1>四个变量均呈上升的趋势。
<2>第二产业的增幅较为明显。
<3>第二产业和第三产业的差距在后三年相差更大。

第二步:确定分析数列
<1>母序列(又称参考数列,母指标):能反映系统行为特征的数据序列。类似于因变量Y,此处记为X。
<2>子序列(又称比较数列,子指标):影响系统行为的因素组成的数据序列。类似于自变量X,此处记为x1,x2,x…xm。
在本例中:国内生产总值就是母序列,第一,第二和第三产业就是子序列。

第三步:对变量进行预处理(两个目的:去量纲,缩小变量范围简化计算)
对母序列和子序列的没个指标进行预处理:先求出每个指标的均值,再用该指标中的每个元素都除以其均值。
灰色关联分析_第3张图片

第四步:计算子序列中各个指标与母序列的关联系数
灰色关联分析_第4张图片

然后利用上式即可求出每一项对应的关联系数:
灰色关联分析_第5张图片

第五步:在这里插入图片描述
也就是求其算术平均值。

第六步:通过比较三个子序列和母序列的关联度可以得到结论。
该地区在2000年至2005年间的国内生产总值受到第三产业的影响最大。(其灰色关联度最大)
代码实现:

Mean = mean(gdp);  % 求出每一列的均值以供后续的数据预处理
gdp = gdp ./ repmat(Mean,size(gdp,1),1);  %size(gdp,1)=6, repmat(Mean,6,1)可以将矩阵进行复制,复制为和gdp同等大小,然后使用点除(对应元素相除),这些在第一讲层次分析法都讲过
disp('预处理后的矩阵为:'); disp(gdp)
Y = gdp(:,1);  % 母序列
X = gdp(:,2:end); % 子序列
absX0_Xi = abs(X - repmat(Y,1,size(X,2)))  % 计算|X0-Xi|矩阵(在这里我们把X0定义为了Y)
a = min(min(absX0_Xi))    % 计算两级最小差a
b = max(max(absX0_Xi))  % 计算两级最大差b
rho = 0.5; % 分辨系数取0.5
gamma = (a+rho*b) ./ (absX0_Xi  + rho*b)  % 计算子序列中各个指标与母序列的关联系数
disp('子序列中各个指标的灰色关联度分别为:')
disp(mean(gamma))

注:
<1> 什么时候用标准化回归,什么时候用灰色关联度分析?
当样本个数n较大时,一般使用标准化回归;当样本个数n较少时,才用灰色关联分析。
<2> 如果母序列中有多个指标,应该怎样分析?
例如:Y1和Y2是母序列,X1,X2,…,Xm是子序列
那么我们首先计算Y1和X1,X2,…,Xm的灰色关联度进行分析;再计算Y2和X1,X2,…,Xm的灰色关联度进行分析。

2.用于综合评价问题
灰色关联分析_第6张图片

求解步骤:
灰色关联分析_第7张图片
代码实现:

%%  判断是否需要正向化
[n,m] = size(X);
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标']) 
Judge = input(['这' num2str(m) '个指标是否需要经过正向化处理,需要请输入1 ,不需要输入0:  ']);   %1

if Judge == 1
    Position = input('请输入需要正向化处理的指标所在的列,例如第236三列需要处理,那么你需要输入[2,3,6]: '); %[2,3,4]
    disp('请输入需要处理的这些列的指  标类型(1:极小型, 2:中间型, 3:区间型) ')
    Type = input('例如:第2列是极小型,第3列是区间型,第6列是中间型,就输入[1,3,2]:  '); %[2,1,3]
    % 注意,Position和Type是两个同维度的行向量
    for i = 1 : size(Position,2)  %这里需要对这些列分别处理,因此我们需要知道一共要处理的次数,即循环的次数
        X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));
    % Positivization是我们自己定义的函数,其作用是进行正向化,其一共接收三个参数
    % 第一个参数是要正向化处理的那一列向量 X(:,Position(i))   回顾上一讲的知识,X(:,n)表示取第n列的全部元素
    % 第二个参数是对应的这一列的指标类型(1:极小型, 2:中间型, 3:区间型)
    % 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列
    % 该函数有一个返回值,它返回正向化之后的指标,我们可以将其直接赋值给我们原始要处理的那一列向量
    end
    disp('正向化后的矩阵 X =  ')
    disp(X)
end

%% 对正向化后的矩阵进行预处理
Mean = mean(X);  % 求出每一列的均值以供后续的数据预处理
Z = X ./ repmat(Mean,size(X,1),1);  
disp('预处理后的矩阵为:'); disp(Z)

%% 构造母序列和子序列
Y = max(Z,[],2);  % 母序列为虚拟的,用每一行的最大值构成的列向量表示母序列
X = Z; % 子序列就是预处理后的数据矩阵

%% 计算得分
absX0_Xi = abs(X - repmat(Y,1,size(X,2)))  % 计算|X0-Xi|矩阵
a = min(min(absX0_Xi))    % 计算两级最小差a
b = max(max(absX0_Xi))  % 计算两级最大差b
rho = 0.5; % 分辨系数取0.5
gamma = (a+rho*b) ./ (absX0_Xi  + rho*b)  % 计算子序列中各个指标与母序列的关联系数
weight = mean(gamma) / sum(mean(gamma));  % 利用子序列中各个指标的灰色关联度计算权重
score = sum(X .* repmat(weight,size(X,1),1),2);   % 未归一化的得分
stand_S = score / sum(score);   % 归一化后的得分
[sorted_S,index] = sort(stand_S ,'descend') % 进行排序

其中的子函数均为TOPSIS中的函数:TOPSIS

你可能感兴趣的:(数学建模,数学建模)