1、我们看一个例子:
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm
#要求是:绘制各员工在不同柜台业绩平均值的柱状图
#读取数据
df = pd.read_excel(r'超市营业额2.xlsx')
#修改异常值
df.loc[df.交易额 > 3000,'交易额'] = 3000
df.loc[df.交易额 < 200,'交易额'] = 200
#删除重复值
df.drop_duplicates(inplace=True)
#填充缺失值
df['交易额'].fillna(df['交易额'].mean(),inplace=True)
#使用交叉表得到每个人在柜台交易额平均值
print(''.ljust(20,'='))
df_group = pd.crosstab(df.姓名,df.柜台,df.交易额,
aggfunc='mean').apply(round)
#绘制柱状图,默认使用index作为横坐标
df_group.plot(kind='bar')
font = fm.FontProperties(fname=r'书法.ttf')
plt.xlabel('员工业绩分布',fontproperties='simhei')
plt.xticks(fontproperties='simhei')
plt.legend(prop=font)
#显示绘制结果
plt.show()