灰色关联分析法——系统分析或综合评价模型


Q1:什么是系统分析?

        比方说在社会系统、经济系统、农业系统、教育系统中,每个系统都含有许多种因素,而这多种因素共同作用的结果决定了该系统的发展态势,我们常常希望知道在这众多因素中,哪些因素对系统发展影响大,哪些因素对系统发展影响小;哪些是主要因素,哪些是次要因素;哪些对系统发展起推动作用,哪些对系统发展起阻碍作用……这就是所谓的系统分析。举个栗子,粮食生产系统中,影响粮食产量的因素有播种面积、土壤、浇水施肥、气候、耕作技术等等,我们希望实现少投入多产出,取得良好的经济效益、社会效益和生态效益,那么就必须进行系统分析。

        数理统计中的回归分析、方差分析、主成分分析等都是用来进行系统分析的方法。这些方法都有下列不足之处(引用自某文章):
(1)要有大量数据支持,数据量少就难以找出统计规律;
(2)样本要服从某个典型的概率分布,要求各因素数据与系统特征数据之间呈线性关系且各因素之间彼此无关,而这些要求往往难以满足;
(3)可能出现量化结果与定性分析结果不符的现象,导致系统的关系和规律遭到歪曲和颠倒。

Q2:什么是灰色关联分析?

        灰色关联分析的基本思想是根据序列曲线几何形状的相似程度来判断其联系是否紧密。曲线越接近,相应序列之间的关联度就越大,反之就越小。
        灰色关联分析方法弥补了采用数理统计方法作系统分析所导致的缺憾。它对样本量的多少和样本有无规律都同样适用,而且计算量小,十分方便,更不会出现量化结果与定性分析结果不符的情况。(注:系统分析中灰色关联分析方法目前不是主流,主流还是数理统计中的方法)



应用一:进行系统分析

下表为某地区国内生产总值的统计数据(以百万元计),问该地区从2000年到2005年之间哪一种产业对GDP总量影响最大。

年份 国内生产总值 第一产业 第二产业 第三产业
2000 1988 386 839 763
2001 2061 408 846 808
2002 2335 422 960 953
2003 2750 482 1258 1010
2004 3356 511 1577 1268
2005 3806 561 1893 1352

一、画统计图

灰色关联分析法——系统分析或综合评价模型_第1张图片

(画图后配上简单的分析)
        由图表可知:四个变量均呈上升的趋势;第二产业的增幅较为明显;第二产业和第三产业的差距在后三年相差更大。

二、确定分析数列
(1)母序列(又称参考数列、母指标):能反映系统行为特征的数据序列。——类似于因变量y,此处即为X0;
(2)子序列(又称比较数列、子指标):影响系统行为的因素组成的数据序列。——类似于自变量x,此处记为(x1,x2,x3,…,xm)。
        故在本例中:国内生产总值就是母序列X0,第一、第二、第三产业就是子序列X1、X2、X3.

三、对变量进行预处理(两个目的:去量纲(标准化);缩小变量范围简化计算)
        对母序列和子序列中的每个指标进行预处理:先求出每个指标的均值,再把该指标的每个元素都除以其均值。

四、计算子序列中各个指标与母序列的关联系数
母序列:  X0 = (x0_(1),x0_(2),……,x0_(n))'
子序列:  X1 = (x1_(1),x1_(2),……,x1_(n))'
                X2 = (x2_(1),x2_(2),……,x2_(n))'
                   …………
                Xm = (xm_(1),xm_(2),……,xm_(n))'

在这里我们令
母序列:  X0 = (x0_(1),x0_(2),x0_(3),x0_(4),x0_(5),x0_(6))'
子序列:  X1 = (x1_(1),x1_(2),x1_(3),x1_(4),x1_(5),x1_(6))'
                X2 = (x2_(1),x2_(2),x2_(3),x2_(4),x2_(5),x2_(6))'
                X3 = (x3_(1),x3_(2),x3_(3),x3_(4),x3_(5),x3_(6))'

记 a = min|x0_(k) - xi_(k)|,b = max|x0_(k) - xi_(k)|. 称a、b分别为两级最小差和两级最大差。
在本例中有:

| X0 - X1 | | X0 - X2 | | X0 - X3 |
0.1041 0.0492 0.0119
0.1249 0.0704 0.0289
0.0544 0.0785 0.0694
0.0315 0.0112 0.0278
0.1288 0.0477 0.0006
0.1862 0.1392 0.0832

故两级最小差a = 0.0006,两级最大差b = 0.1862.
我们给出如下定义:

ρ为分辨系数一般取0.5,故在求出a、b后,分子即为一个常数,而分母中的|x0_(k) - xi_(k)|在上表中已经求出,我们将其一一代入这个式子即可得到:

0.4751 0.6586 0.8922
0.4299 0.5733 0.7680
0.6356 0.5462 0.5766
0.7520 0.8985 0.7753
0.4224 0.6657 1.0000
0.3356 0.4035 0.5317

 比如第一个数据 0.4751 = (0.0006 + 0.5×0.1862) / (0.1041 + 0.5×0.1862).

五、计算灰色关联度
定义 γ(X0, Xi) =  为X0和Xi的灰色关联度
因此我们有 γ(X0, X1) = 0.5084,γ(X0, X2) = 0.6243,γ(X0, X3) = 0.7573.

六、得出结论
通过比较三个子序列和母序列的关联度我们可以得出结论:
该地区在2000年至2005年间的国内生产总值受到第三产业的影响最大。(其灰色关联度最大)

(注:灰色关联分析研究的人比较少,主要是国内有部分人研究,在论文中谨慎使用)


 思考:
(1)什么时候用标准化回归,什么时候用灰色关联分析?
        当样本个数n较大时,一般使用标准化回归;当样本个数n较小时,可考虑使用灰色关联分析。
(2)如果母序列中有多个指标时,应该怎么分析?(例如Y1和Y2是母序列,X1,X2,…,Xm是子序列)
        我们可首先计算Y1和X1,X2,…,Xm的灰色关联度进行分析,再计算Y2和X1,X2,…,Xm的灰色关联度进行分析。



应用二:用于综合评价

        在之前我们已经介绍过进行综合评价有两个模型:层次分析法(AHP)和优劣解距离法(TOPSIS)。它们的区别在于层次分析法用于没有数据,TOPSIS用于有数据时,现在我们将要讲的灰色关联分析也是用于有数据时的评价方法。另外在用TOPSIS时如果需要确定指标权值可以用熵权法解决,也可以用层次分析法。在有了之前的基础上,现简要介绍一下灰色关联分析进行评价的过程。

主要步骤:
(1)对指标数据进行正向化(可参考TOPSIS中的正向化方法);
(2)对正向化后的矩阵进行数据预处理(可参考上面系统分析中和之前讲过的预处理方法),得到矩阵Z_{n*m}
(3)将预处理后的矩阵每一行取出最大值构成母序列(这里的母序列其实是虚构的,因为我们是对指标进行评价,不像系统分析中母序列其实是因变量)
(4)计算各个指标与母序列的灰色关联度:γ1、γ2、……、γm.
(5)计算各个指标的权重:w1 = γ1 / (γ1+γ2+…+γm)、……、wm = γm / (γ1+γ2+…+γm)
(6)第k个评价对象的得分:S_{k} = \sum_{j=1}^{m}Z_{kj}\cdot \gamma _{j},(k = 1,2,…,n)
(7)对得分进行归一化:S_{k}' = S_{k}/(S_{1}+S_{2}+…+S_{n}) ;
(8)对结果可视化。

你可能感兴趣的:(数学建模,数学建模,数据分析,线性代数,矩阵)