import numpy as np
import pandas as pd
#按指定路径导入数据,以“地区”为索引(文件路径需按实际情况更换)
data = pd.read_excel(r'C:/Users/AROUS/Desktop/综合评价数据.xlsx', index_col = '地区')
data
使用min-max标准化方法标准化数据后,各评价指标的最大值为1,最小值为0
正向指标(指标值越大越好)的min-max标准化计算公式为:
y i j = x i j − min x i j max x i j − min x i j ( 1 ≤ i ≤ n , 1 ≤ j ≤ m ) y_{ij} = \frac{x_{ij} - \min{x_{ij}}}{\max{x_{ij}} - \min{x_{ij}}} \quad (1 \leq i \leq n,1 \leq j \leq m) yij=maxxij−minxijxij−minxij(1≤i≤n,1≤j≤m), n n n为评价对象的个数, m m m为评价指标的个数
负向指标(指标值越小越好)的min-max标准化计算公式为:
y i j = max x i j − x i j max x i j − min x i j ( 1 ≤ i ≤ n , , 1 ≤ j ≤ m ) y_{ij} = \frac{\max{x_{ij}} - x_{ij}}{\max{x_{ij}} - \min{x_{ij}}} \quad (1 \leq i \leq n, , 1 \leq j \leq m) yij=maxxij−minxijmaxxij−xij(1≤i≤n,,1≤j≤m), n n n为评价对象的个数, m m m为评价指标的个数
#定义正向指标min-max标准化函数
def minmax_p(x):
return (x - x.min()) / (x.max() - x.min())
#定义负向指标min-max标准化函数
def minmax_n(x):
return (x.max() - x) / (x.max() - x.min())
#使用正向指标min-max标准化函数标准化数据
data_m = data.apply(minmax_p, axis = 0)
data_m
第 i i i个评价对象的第 j j j项评价指标的特征比重的计算公式为:
p i j = y i j ∑ i = 1 n y i j p_{ij} = \frac{y_{ij}}{\sum_{i=1}^{n} y_{ij}} pij=∑i=1nyijyij, n n n为评价对象的个数
pij = data_m / data_m.sum()
pij
第 j j j项评价指标的熵值的计算公式为:
e j = − 1 ln ( n ) ∑ i = 1 n p i j ln ( p i j ) e_j = -\frac{1}{\ln(n)} \sum_{i=1}^{n} p_{ij} \ln(p_{ij}) ej=−ln(n)1∑i=1npijln(pij), n n n为评价对象的个数
#把pij中的0替换为一个非零的极小值,避免出现ln(0)的警告
#函数len用于返回对象的长度或元素个数
pij = pij.replace(0, 1e-100)
ei = -1 / np.log(len(data_m)) * np.sum(pij * np.log(pij), axis = 0)
ei
第 j j j项评价指标的差异系数的计算公式为:
d j = 1 − e j d_j = 1 - e_j dj=1−ej
di = 1 - ei
di
#归一化评价指标的差异系数
w = di / di.sum()
w
data['熵权法得分'] = data_m.dot(w)
data
data.to_excel('熵权法综合评价结果.xlsx', index = True)