python熵权法,输出为标准化数据+各指标权重+各行得分+总得分

熵权法计算
1.数据标准化
2.计算哥指标权重
3.计算各样本/行得分(此得分为用标准化数据计算而来,本人也有一篇文章是用原始数据计算分值,感兴趣可以参考)
4.结果输出

直接整理成一整块代码,之前代码为定义了权重函数和得分函数,因为自己用,代码量少,所以这个直接都放一起了,我觉得用标准化后的数据计算比较直观一些

# -*- encoding=utf-8 -*-
import warnings
warnings.filterwarnings("ignore")
import pandas as pd
import numpy as np
import os
os.chdir(r"E:\BaiduNetdiskDownload\数据")   #指定路径

data = pd.read_excel("指标.xlsx", encoding='utf8')
data = data.iloc[:, 1:]  #数据选择第二列开始,所有行

# 数据标准化
data = (data - data.min())/(data.max() - data.min())

#计算k
m,n = data.shape  #m行k列
data1 = data.as_matrix(columns = None)    #将dataframe格式转化为matrix格式/矩阵,为了使用方便在这将矩阵和dataframe格式的分别用一个变量
k = 1/np.log(m)
yij = data1.sum(axis = 0)

#计算pij
pij = data1/yij
test = pij*np.log(pij)
test = np.nan_to_num(test)

#计算每种指标的信息熵
ej = -k*(test.sum(axis = 0))
#计算每种指标的权重
wi = (1 - ej)/np.sum(1 - ej)
wi_list = list(wi)   #权重列表

#计算得分
#  将权重转换为矩阵
cof_var = np.mat(wi_list)
#  权重跟自变量相乘
score = data1 * cof_var.T   #data1为矩阵,计算每一行得分
score = pd.DataFrame(score)   #转换格式
#  累加求和得到总分
total_score = list(score.apply(sum))

#最后输出
data = data.reindex(index=list(data.index)+['权重'])   #增加一个新的行,行索引直接重置
data.loc["权重"] = wi_list   #为新行赋值
data['score']= score + [0]   #因为增加了一行,所以要多加一个数
data["年份"] = [2000,2001,2002,2003,2004,2005,2006,2007,2008,2009,2010,2011,2012,2013,2014,2015,2016,2017,2018,0]
data.to_excel("结果.xlsx", sheet_name="sheet1", index= False,encoding="utf-8")

print(wi_list)   # 权重
print(total_score)   #总得分
print(score)  #每行数据得分

你可能感兴趣的:(python代码,商业分析)