本文大部分是对于数学建模清风老师的课程学习总结归纳而来,我的理解可能有错误,大家发现错误可以在评论区批评指正,课程地址:《数学建模清风》
TOPSIS法(Technique for Order Preference by Similarity to Ideal Solution)可翻译为逼近理想解排序法,国内常简称为优劣解距离法
TOPSIS 法是一种常用的综合评价方法,其能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距。
为了对众多方案给出一个排序,在给出所有方案之后,可以根据这些数据,构造出一个所有方案组成的系统中的理想最优解和最劣解。而TOPSIS的想法就是,通过一定的计算,评估方案系统中任何一个方案距离理想最优解和最劣解的综合距离。如果一个方案距离理想最优解越近,距离最劣解越远,我们就有理由认为这个方案更好。那理想最优解和最劣解又是什么呢?很简单,理想最优解就是该理想最优方案的各指标值都取到系统中评价指标的最优值,最劣解就是该理想最劣方案的各指标值都取到系统中评价指标的最劣值。
理想最优解中的数据都是各方案中的数据,而不要选择方案中没有的数据,理想最劣解同理。
topsis算法进行建模,总体分为以下四个步骤:
接下来,我会通过例题来具体讲解topsos算法原理与用法。
指标名称 | 指标特点 | 例子 |
---|---|---|
极大型(效益性指标) | 越大(多)越好 | 成绩、GDP增速、企业利润 |
较小型(成本型)指标 | 越小(少)越好 | 费用、坏频率、污染程度 |
中间型指标 | 越接近某个值越好 | 水质量评估时的PH值 |
区间型指标 | 落在某个区间最好 | 体温、水中植物性营养物量 |
在topsis法中,所谓的原始矩阵正向化,就是要将所有指标类型统一转化为极大型指标。
极小型指标——>极大型指标
某各寝室有四个人,已知他们的成绩和与他人的争吵次数,现在要对他们的综合素质进行评价。
姓名 | 成绩 | 与他人争吵次数 | 正向化后的争吵次数 |
---|---|---|---|
小明 | 89 | 2 | 1 |
小王 | 60 | 0 | 3 |
小张 | 74 | 1 | 2 |
小李 | 99 | 3 | 0 |
指标类型 | 极大型 | 极小型 | 极大型 |
将极小型指标转换为极大型指标的公式:
m a x − x ( 常用) max-x(常用) max−x(常用)
如果所有元素均为正数,那么也可以使用: 1 / x 1/x 1/x(公式不唯一)
中间型指标——>极大型指标
中间型指标: 指标值既不要太大也不要太小,取某特定值最好(如水质量评估 PH 值)
x i {x_i} xi是一组中间型指标序列,且最佳的数值为 x b e s t x_{best} xbest,那么正向化的公式如下:
M = m a x { ∣ x i − x b e s t ∣ } , x i ˉ = 1 − ∣ x i − x b e s t ∣ M M=max\{|x_i-x_{best}|\},\bar{x_i}=1- \frac{|x_i-x_{best}|}{M} M=max{∣xi−xbest∣},xiˉ=1−M∣xi−xbest∣
在本题中: x b e s t = 7 , M = m a x { ∣ 6 − 7 ∣ , ∣ 7 − 7 ∣ , ∣ 8 − 7 ∣ , ∣ 9 − 7 ∣ } = 2 在本题中:x_{best}=7,M=max\{|6-7|,|7-7|,|8-7|,|9-7|\}=2 在本题中:xbest=7,M=max{∣6−7∣,∣7−7∣,∣8−7∣,∣9−7∣}=2
PH值(转换前) | PH值(转换后) |
---|---|
6 | 1/2 |
7 | 1 |
8 | 1/2 |
9 | 0 |
区间型指标 ——> 极大型指标
**区间型指标:**指标值落在某个区间内最好,例如人的体温在36°~37°这个区间比较好。
x i {x_i} xi是一组区间型指标序列,且最佳的区间为[a,b],那么正向化的公式如下:
M = m a x { a − m i n { x i } , m a x { x i } − b } , x i ˉ = { 1 − a − x i M x i < a 1 a ≤ x i ≤ b 1 − x i − b M x i > b M=max\{a-min\{x_i\},max\{x_i\}-b \},\bar{x_i}=\begin{cases} 1- \frac{a-x_i}{M}& x_i < a \\ 1 & a \leq x_i \leq b\\ 1- \frac{x_i-b}{M} & x_i > b\end{cases} M=max{a−min{xi},max{xi}−b},xiˉ=⎩ ⎨ ⎧1−Ma−xi11−Mxi−bxi<aa≤xi≤bxi>b
体温(转换前 | 体温(转换后) |
---|---|
35.2 | 0.4286 |
35.8 | 0.8571 |
36.6 | 1 |
37.1 | 0.9286 |
37.8 | 0.4286 |
38.4 | 0 |
在这个例子中, a = 36 , b = 37 a=36,b=37 a=36,b=37,所以:
m a x { 36 − 35.2 , 38.4 − 37 } = 1.4 max\{36-35.2,38.4-37\}=1.4 max{36−35.2,38.4−37}=1.4
然后通过 x i ˉ \bar{x_i} xiˉ公式计算得到上表。
在开始前我们需要明确一点:标准化的目的是消除不同指标量纲的影响!
假设有 n n n个要评价的对象, m m m个评价指标(已经正向化)构成的正向化矩阵如下:
X = [ x 11 x 12 ⋯ x 1 m x 21 x 22 ⋯ x 2 m ⋮ ⋮ ⋱ ⋮ x n 1 x n 2 ⋯ x n m ] 那么,对其标准化的矩阵记为 Z , Z 中的每一个元素 : z i j = x i j ∑ i = 0 n x i j 2 ( 每一个元素 其所在列的元素的平方和 ) X=\left[ \begin{matrix} x_{11} & x_{12} & \cdots & x_{1m} \\ x_{21} & x_{22} & \cdots & x_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ x_{n1} & x_{n2} & \cdots & x_{nm} \\ \end{matrix} \right] \\那么,对其标准化的矩阵记为Z,Z中的每一个元素: \\ \ \\z_{ij}=\frac{x_{ij}}{\sqrt{\sum^{n}_{i = 0}x^2_{ij}}} (\frac{每一个元素}{\sqrt{其所在列的元素的平方和}}) X=⎣ ⎡x11x21⋮xn1x12x22⋮xn2⋯⋯⋱⋯x1mx2m⋮xnm⎦ ⎤那么,对其标准化的矩阵记为Z,Z中的每一个元素: zij=∑i=0nxij2xij(其所在列的元素的平方和每一个元素)
注意:标准化的方法有很多种,其主要目的就是去除量纲的影响,文章介绍的方法知识较为常用的一种标准化方法。
对第一个例子中的矩阵进行处理:
[ 89 1 60 3 74 2 99 0 ] 经过标准化就变成了 [ 0.5437 0.2673 0.3665 0.8018 0.4520 0.5345 0.6048 0 ] \left[ \begin{matrix} 89 &1\\ 60 & 3\\ 74 & 2\\ 99 & 0 \end{matrix} \right] 经过标准化就变成了 \left[ \begin{matrix} 0.5437 &0.2673\\ 0.3665 & 0.8018\\ 0.4520 & 0.5345\\ 0.6048 & 0 \end{matrix} \right] ⎣ ⎡896074991320⎦ ⎤经过标准化就变成了⎣ ⎡0.54370.36650.45200.60480.26730.80180.53450⎦ ⎤
假设有 n n n个要评价的对象, m m m个评价指标的标准化矩阵:
Z = [ z 11 z 12 ⋯ z 1 m z 21 z 22 ⋯ z 2 m ⋮ ⋮ ⋱ ⋮ z n 1 z n 2 ⋯ z n m ] Z= \left[ \begin{matrix} z_{11} & z_{12} & \cdots & z_{1m} \\ z_{21} & z_{22} & \cdots & z_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ z_{n1} & z_{n2} & \cdots &z_{nm} \\ \end{matrix} \right] Z=⎣ ⎡z11z21⋮zn1z12z22⋮zn2⋯⋯⋱⋯z1mz2m⋮znm⎦ ⎤
定义最大值: Z + = ( Z 1 + , Z 2 + , ⋯ , Z m + ) Z^+=(Z^+_1,Z^+_2, \cdots,Z^+_m) Z+=(Z1+,Z2+,⋯,Zm+)
= ( m a x { z 11 , z 21 , ⋯ , z n 1 } , m a x { z 12 , z 22 , ⋯ , z n 2 } , ⋯ , m a x { z 1 m , z 2 m , ⋯ , z n m } ) =(max\{z_{11},z_{21}, \cdots,z_{n1}\},max\{z_{12},z_{22}, \cdots,z_{n2}\},\cdots,max\{z_{1m},z_{2m}, \cdots,z_{nm}\}) =(max{z11,z21,⋯,zn1},max{z12,z22,⋯,zn2},⋯,max{z1m,z2m,⋯,znm})
定义最小值: Z − = ( Z 1 − , Z 2 − , ⋯ , Z m − ) Z^-=(Z^-_{1},Z^-_{2},\cdots,Z^-_{m}) Z−=(Z1−,Z2−,⋯,Zm−)
= ( m i n { z 11 , z 21 , ⋯ , z n 1 } , m i n { z 12 , z 22 , ⋯ , z n 2 } , ⋯ , m i n { z 1 m , z 2 m , ⋯ , z n m } ) =(min\{z_{11},z_{21}, \cdots,z_{n1}\},min\{z_{12},z_{22}, \cdots,z_{n2}\},\cdots,min\{z_{1m},z_{2m}, \cdots,z_{nm}\}) =(min{z11,z21,⋯,zn1},min{z12,z22,⋯,zn2},⋯,min{z1m,z2m,⋯,znm})
定义第 i ( i = 1 , 2 , ⋯ , n ) i(i=1,2,\cdots,n) i(i=1,2,⋯,n)个评价对象与最大值的距离 D i + = ∑ j = 1 m ( Z j + − z i j ) 2 D^+_i=\sqrt{\sum^m_{j=1}{(Z^+_j-z_{ij})^2}} Di+=∑j=1m(Zj+−zij)2
定义第 i ( i = 1 , 2 , ⋯ , n ) i(i=1,2,\cdots,n) i(i=1,2,⋯,n)个评价对象与最小值的距离 D i − = ∑ j = 1 m ( Z j − − z i j ) 2 D^-_i=\sqrt{\sum^m_{j=1}{(Z^-_j-z_{ij})^2}} Di−=∑j=1m(Zj−−zij)2
那么,我们可以计算出第 i ( i = 1 , 2 , ⋯ , n ) i(i=1,2,\cdots,n) i(i=1,2,⋯,n)个评价对象未归一化的得分: S i = D i − D i + + D i − S_i=\frac{D^-_i}{D^+_i+D^-_i} Si=Di++Di−Di−
很明显 0 ≤ S i ≤ 1 0\leq S_i\leq 1 0≤Si≤1,且 S ˉ i = S i / ∑ i = 1 n S i 。这样的话 ∑ i = 1 n S ˉ i = 1 \bar S_i = S_i / \sum^n_{i=1}{S_i}。这样的话\sum^{n}_{i=1}{\bar S_i}=1 Sˉi=Si/∑i=1nSi。这样的话∑i=1nSˉi=1(注意:得分归一化不影响排序)
对于例题计算过程这里就不演示了,最终的得分结果如下:
姓名 | D + D^+ D+ | D − D^- D− | 未归一化得分 | 归一化后得分 | 排名 |
---|---|---|---|---|---|
小明 | 0.5380 | 0.3206 | 0.3734 | 0.1857 | 3 |
小王 | 0.2382 | 0.8018 | 0.7709 | 0.3834 | 1 |
小张 | 0.3078 | 0.5413 | 0.6375 | 0.3170 | 2 |
小李 | 0.8018 | 0.2382 | 0.2291 | 0.1139 | 4 |
TOPSIS 法别名优劣解距离法,其主要利用数据的信息,精确的反应评价方案之间的优劣差距。TOPSIS 法多用于解决多指标的决策性问题,其实现原理为通过计算各备选方案与正负理想解之间的相对距离来进行排序并做出选择。其主要步骤如下:
在上面给的例题中默认了各项指标的权重相同,但在实际的评价中指标都是有各自的权重,因此应该用权重对公式进行修正,修正后的公式如下( ω \omega ω代表权重):
D i + = ∑ j = 1 m ω j ( Z j + − z i j ) 2 , D i − = ∑ j = 1 m ω j ( Z j − − z i j ) 2 D^+_i=\sqrt{\sum^m_{j=1} \omega_j(Z^+_j-z_{ij})^2},D^-_i=\sqrt{\sum^m_{j=1} \omega_j(Z^-_j-z_{ij})^2} Di+=j=1∑mωj(Zj+−zij)2,Di−=j=1∑mωj(Zj−−zij)2
Ps:给指标赋权重,理所当然地我们想到了上一篇文章中的层次分析法,但层次分析法的主观性太强了,更推荐大家使用熵权法来进行客观赋值。
PPs:建模做题的时候建议同学们使用综合主观和客观的权重,因为其更具有说服力!
定义:熵权法是一种客观赋权的方法(客观 = 数据本身就可以告诉我们权重)
PS:当一个指标都是相同数值时,那么我们可认为这个指标的权值为0,因此我们可以看出熵权法基于数据本身进行计算,它的客观只是相对的。
假设 x x x表示时间 X X X可能发生的某种情况, p ( x ) p(x) p(x)表示这种情况发生的概率。
我们可以定义: I ( x ) = − ln ( p ( x ) ) I(x)=-\ln(p(x)) I(x)=−ln(p(x)),因为 0 ≤ p ( x ) ≤ 1 0\leq p(x) \leq 1 0≤p(x)≤1,所以 I ( x ) ≥ 0 I(x)\geq 0 I(x)≥0如果时间 X X X可能发生的情况分为: x 1 , x 2 , ⋯ , x n x_1,x_2,\cdots,x_n x1,x2,⋯,xn
那么我们可以定义时间X的信息熵为:
H ( X ) = ∑ i = 1 n [ p ( x i ) I ( x i ) ] = − ∑ i = 1 n [ p ( x i ) ln ( p ( x i ) ) ] H(X)=\sum^n_{i=1}{[p(x_i)I(x_i)]}=-\sum^n_{i=1}{[p(x_i)\ln(p(x_i))]} H(X)=i=1∑n[p(xi)I(xi)]=−i=1∑n[p(xi)ln(p(xi))]
从上面的公式可以看出,信息熵的本质就是对信息量的期望值。
可以证明的是:
当 p ( x 1 ) = p ( x 2 ) = ⋯ = p ( x n ) = 1 n 时, H ( x ) 取最大值,此时 H ( x ) = ln ( n ) 当p(x_1)=p(x_2)=\cdots=p(x_n)=\frac{1}{n}时,H(x)取最大值,此时H(x)=\ln(n) 当p(x1)=p(x2)=⋯=p(xn)=n1时,H(x)取最大值,此时H(x)=ln(n)
(1)矩阵的标准化
判断输入的矩阵中是否存在负数,如果有,则要重新标准化到非负区间(后面计算概率时需要保证每一个元素为非负数)
假设有 n n n个要评价的对象, m m m个评价指标(已正向化)构成的正向化矩阵如下:
X = [ x 11 x 12 ⋯ x 1 m x 21 x 22 ⋯ x 2 m ⋮ ⋮ ⋱ ⋮ x n 1 x n 2 ⋯ x n m ] X= \left[ \begin{matrix} x_{11} & x_{12} & \cdots & x_{1m} \\ x_{21} & x_{22} & \cdots & x_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ x_{n1} & x_{n2} & \cdots &x_{nm} \\ \end{matrix} \right] X=⎣ ⎡x11x21⋮xn1x12x22⋮xn2⋯⋯⋱⋯x1mx2m⋮xnm⎦ ⎤
那么,对其标准化的矩阵记为 Z Z Z, Z Z Z中的每一个元素: z i j = x i j ∑ i = 1 n x i j 2 z_{ij}=x_{ij}\sqrt{\sum^n_{i=1}{x^2_{ij}}} zij=xij∑i=1nxij2
判断 Z Z Z矩阵中是否存在负数,如果存在的话,需要对 X X X使用另一种标准化方式,对矩阵 X X X进行一次标准化得到 Z ˉ \bar Z Zˉ矩阵,其标准化公式为:
z ˉ i j = x i j − m i n { x 1 j , x 2 j , ⋯ , x n j } m a x { x 1 j , x 2 j , ⋯ , x n j } − m i n { x 1 j , x 2 j , ⋯ , x n j } \bar z_{ij}=\frac{x_{ij}-min\{x_{1j},x_{2j},\cdots,x_{nj}\}}{max\{x_{1j},x_{2j},\cdots,x_{nj}\}-min\{x_{1j},x_{2j},\cdots,x_{nj}\}} zˉij=max{x1j,x2j,⋯,xnj}−min{x1j,x2j,⋯,xnj}xij−min{x1j,x2j,⋯,xnj}
(2)计算指标比重
计算第 j 项指标下第 i 个样本所占的比重,并将其看作相对熵计算中用到的概率。
假设有 n nn 个要评价的对象,m mm 个评价指标,且经过了上一步处理得到的非负矩阵为:
Z ˉ = [ z 11 z 12 ⋯ z 1 m z 21 z 22 ⋯ z 2 m ⋮ ⋮ ⋱ ⋮ z n 1 z n 2 ⋯ z n m ] \bar Z= \left[ \begin{matrix} z_{11} & z_{12} & \cdots & z_{1m} \\ z_{21} & z_{22} & \cdots & z_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ z_{n1} & z_{n2} & \cdots &z_{nm} \\ \end{matrix} \right] Zˉ=⎣ ⎡z11z21⋮zn1z12z22⋮zn2⋯⋯⋱⋯z1mz2m⋮znm⎦ ⎤
我们计算概率矩阵 P P P,其中 P P P中每一个元素 p i j p_{ij} pij的计算公式如下:
p i j = z ˉ i j ∑ i = 1 n z ˉ i j p_{ij}=\frac{\bar z_{ij}}{\sum^n_{i=1}\bar z_{ij}} pij=∑i=1nzˉijzˉij
容易验证: ∑ i = 1 n p i j = 1 \sum^n_{i=1}p_{ij}=1 ∑i=1npij=1,既保证了每一个指标所对应的概率和为1。
(3)计算得到熵权
计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标的熵权。
对于第 j j j个指标而言,信息熵的计算公式:
e j = − 1 ln ( n ) ∑ i = 1 n p i j ln ( p i j ) ( j = 1 , 2 , ⋯ , m ) e_j=-\frac{1}{\ln(n)}\sum^n_{i=1}{p_{ij}}{\ln(p_{ij})}(j=1,2,\cdots,m) ej=−ln(n)1i=1∑npijln(pij)(j=1,2,⋯,m)
注意:这里 p i j p_{ij} pij如果为0,那么需要指定 ln ( 0 ) \ln(0) ln(0)=0。
这里有两个问题需要确定
(1)为什么这里要除以 ln ( n ) \ln(n) ln(n)这个常数?
前文提到,当 p ( x 1 ) = p ( x 2 ) = ⋯ = p ( x n ) = 1 n 时, H ( x ) 取最大值,此时 H ( x ) = ln ( n ) 这里除以 ln ( n ) 能够使得信息熵的始终位于 [ 0 , 1 ] 区间上面。 p(x_1)=p(x_2)=\cdots=p(x_n)=\frac{1}{n}时,H(x)取最大值,此时H(x)=\ln(n)这里除以\ln(n)能够使得信息熵的始终位于[0,1]区间上面。 p(x1)=p(x2)=⋯=p(xn)=n1时,H(x)取最大值,此时H(x)=ln(n)这里除以ln(n)能够使得信息熵的始终位于[0,1]区间上面。
(2) e j 越大,即第 j 个指标的信息嫡越大,表明第 j 个指标的信息越多还是越少 ? ej 越大,即第 j 个指标的信息嫡越大,表明第 j 个指标的信息越多还是越少? ej越大,即第j个指标的信息嫡越大,表明第j个指标的信息越多还是越少?
答案是越少,当 p 1 j = p 2 j = ⋯ = p n j 时, e j = 1 p_{1j}=p_{2j}=\cdots=p_{nj}时,e_j=1 p1j=p2j=⋯=pnj时,ej=1,此时上面定义的信息熵达到最大,但是,因为 p i j = z ˉ i j / ∑ i = 1 n z ˉ i j ,所以 z ˉ 1 j = z ˉ 2 j = ⋯ = z ˉ n j p_{ij}=\bar z_{ij}/\sum^n_{i=1}{\bar z_{ij}},所以\bar z_{1j}=\bar z_{2j}=\cdots=\bar z_{nj} pij=zˉij/∑i=1nzˉij,所以zˉ1j=zˉ2j=⋯=zˉnj,即所有样本的这个指标值都相同。
信息效用值的定义: d j = 1 − e j d_j=1-e_j dj=1−ej,那么信息效用值越大,其对应的信息就越多。
将信息效用值进行归一化,我们就能够得到每个指标的熵权: ω j = d j / ∑ j = 1 m d j ( j = 1 , 2 , ⋯ , m ) \omega_j=d_j/\sum^m_{j=1}d_{j}(j=1,2,\cdots,m) ωj=dj/∑j=1mdj(j=1,2,⋯,m)
熵权法的使用步骤分为三步:
topsis法:
%% 第一步:把数据复制到工作区,并将这个矩阵命名为X
clear
clc
load data_water_quality.mat;%将name换成mat文件名
%% 第二步:判断是否需要正向化
[n,m]=size(X);
disp(['共有',num2str(n),'个评价对象,',num2str(m),'个评价指标'])
Judge=input(['这',num2str(m),'个指标是否需要经过正向化处理,需要请输入1,不需要输入0: ']);
if Judge == 1
Position = input('请输入需要正向化处理的指标所在的列,如第2,4,5三列需要处理,那么输入[2,4,5]: ');
disp('请输入需要处理的这些列的指标类型(1:极小型,2:中间型,3:区间型)')
Type = input('例如:第2列是极小型,第3列是区间型,第6列是中间型,就输入[1,3,2]: '); %[2,1,3]
% 注意,Position和Type是两个同维度的行向量
for i = 1 : size(Position,2) %这里需要对这些列分别处理,因此我们需要知道一共要处理的次数,即循环的次数
X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));
% Positivization是我们自己定义的函数,其作用是进行正向化,其一共接收三个参数
% 第一个参数是要正向化处理的那一列向量 X(:,Position(i)) 回顾上一讲的知识,X(:,n)表示取第n列的全部元素
% 第二个参数是对应的这一列的指标类型(1:极小型, 2:中间型, 3:区间型)
% 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列
% 该函数有一个返回值,它返回正向化之后的指标,我们可以将其直接赋值给我们原始要处理的那一列向量
end
disp('正向化后的矩阵 X = ')
disp(X)
end
%% 第三步:对正向化后的矩阵进行标准化
Z=X./repmat(sum(X.*X).^0.5,n,1);
disp('标准化后的矩阵Z=')
disp(Z)
%% 让用户判断是否需要增加权重
disp("请输入是否需要增加权重向量,需要输入1,不需要输入0")
Judge = input('请输入是否需要增加权重: ');
if Judge == 1
Judge = input('使用熵权法确定权重请输入1,否则输入0: ');
if Judge == 1
if sum(sum(Z<0)) >0 % 如果之前标准化后的Z矩阵中存在负数,则重新对X进行标准化
disp('原来标准化得到的Z矩阵中存在负数,所以需要对X重新标准化')
for i = 1:n
for j = 1:m
Z(i,j) = [X(i,j) - min(X(:,j))] / [max(X(:,j)) - min(X(:,j))];
end
end
disp('X重新进行标准化得到的标准化矩阵Z为: ')
disp(Z)
end
weight = Entropy_weight_method(Z);
disp('熵权法确定的权重为:')
disp(weight)
else
disp(['如果你有3个指标,你就需要输入3个权重,例如它们分别为0.25,0.25,0.5, 则你需要输入[0.25,0.25,0.5]']);
weight = input(['你需要输入' num2str(m) '个权数。' '请以行向量的形式输入这' num2str(m) '个权重: ']);
OK = 0; % 用来判断用户的输入格式是否正确
while OK == 0
if abs(sum(weight) -1)<0.000001 && size(weight,1) == 1 && size(weight,2) == m % 注意,Matlab中浮点数的比较要小心
OK =1;
else
weight = input('你输入的有误,请重新输入权重行向量: ');
end
end
end
else
weight = ones(1,m) ./ m ; %如果不需要加权重就默认权重都相同,即都为1/m
end
%% 第四步:计算与最大值的距离和最小值的距离,并算出得分
D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;
D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;
S = D_N ./ (D_P+D_N); % 未归一化的得分
disp('最后的得分为:')
stand_S = S / sum(S)
[sorted_S,index] = sort(stand_S ,'descend')
正向化判断:
function [posit_x] = Positivization(x,type,i)
% 输入变量有三个:
% x:需要正向化处理的指标对应的原始列向量
% type: 指标的类型(1:极小型, 2:中间型, 3:区间型)
% i: 正在处理的是原始矩阵中的哪一列
% 输出变量posit_x表示:正向化后的列向量
if type == 1 %极小型
disp(['第' num2str(i) '列是极小型,正在正向化'] )
posit_x = Min2Max(x); %调用Min2Max函数来正向化
disp(['第' num2str(i) '列极小型正向化处理完成'] )
disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
elseif type == 2 %中间型
disp(['第' num2str(i) '列是中间型'] )
best = input('请输入最佳的那一个值: ');
posit_x = Mid2Max(x,best);
disp(['第' num2str(i) '列中间型正向化处理完成'] )
disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
elseif type == 3 %区间型
disp(['第' num2str(i) '列是区间型'] )
a = input('请输入区间的下界: ');
b = input('请输入区间的上界: ');
posit_x = Inter2Max(x,a,b);
disp(['第' num2str(i) '列区间型正向化处理完成'] )
disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
else
disp('没有这种类型的指标,请检查Type向量中是否有除了1、2、3之外的其他值')
end
end
极小型正向化:
function [posit_x] = Min2Max(x)
posit_x = max(x) - x;
%posit_x = 1 ./ x; %如果x全部都大于0,也可以这样正向化
end
中值型正向化:
function [posit_x] = Mid2Max(x,best)
M = max(abs(x-best));
posit_x = 1 - abs(x-best) / M;
end
区间型正向化:
function [posit_x] = Inter2Max(x,a,b)
r_x = size(x,1); % row of x
M = max([a-min(x),max(x)-b]);
posit_x = zeros(r_x,1); %zeros函数用法: zeros(3) zeros(3,1) ones(3)
% 初始化posit_x全为0 初始化的目的是节省处理时间
for i = 1: r_x
if x(i) < a
posit_x(i) = 1-(a-x(i))/M;
elseif x(i) > b
posit_x(i) = 1-(x(i)-b)/M;
else
posit_x(i) = 1;
end
end
end
熵权法:
function[W] = Entropy_weight_method(Z)
% 计算有n个样本,m个指标的样本所对应的的熵权
% 输入
% Z : n*m的矩阵(要经过正向化和标准化处理,且元素中不存在负数)
% 输出
% W:熵权,m*1的行向量
%% 计算熵权
[n,m] = size(Z);
D = zeros(1,m); % 初始化保存信息效用值的行向量
for i = 1:m
x = Z(:,i); % 取出第i列的指标
p = x / sum(x);
% 注意,p有可能为0,此时计算ln(p)*p时,Matlab会返回NaN,所以这里我们自己定义一个函数
e = -sum(p .* mylog(p)) / log(n); % 计算信息熵
D(i) = 1- e; % 计算信息效用值
end
W = D ./ sum(D); % 将信息效用值归一化,得到权重
end
function [lnp] = mylog(p)
n = length(p); % 向量的长度
lnp = zeros(n,1); % 初始化最后的结果
for i = 1:n % 开始循环
if p(i) == 0 % 如果第i个元素为0
lnp(i) = 0; % 那么返回的第i个结果也为0
else
lnp(i) = log(p(i));
end
end
end