import numpy as np
import matplotlib.pyplot as plt
import math
data = [160,162,183,174,172,161,171]
bins_size = 5 # 每个bin的宽度,可以自行设置
# 获取所有bin,np.max(data)+bins_size确保所有数值都有bin装,如果np.max(data),这里你会发现样本183没有bin可以装
num_bins = np.arange(np.min(data), np.max(data)+bins_size, bins_size)
# 获取样本频率:Xn
Xn, bins, patches = plt.hist(data,
num_bins,
density = False, # 那么纵坐标表示落入这个bins的样本个数
# density = True, # 那么纵坐标表示落入这个bins的样本概率(密度)
facecolor='blue',
alpha=0.5)
# 获取样本概率:Px
Px = Xn/np.size(data)
# 计算香浓熵
shannonEnt = 0
for i in range(np.size(Px)):
if (Px[i] != 0):
shannonEnt -= Px[i] * math.log(Px[i], 2)
print("shannonEnt:", shannonEnt)
香浓熵的原理看我另一篇博客:从熵到相位传递熵,附matlba和python代码