餐饮企业需求-数据准备

需求:统计每日用餐人数与销售额

分析:目前存在两张订单信息表,

        1.读取两张表数据 (利用pandas库中的函数读取)

        2.合并两张表数据(读取后数据是DataFrame对象)

        3.筛选出日期、人数、金额字段

        4.根据日期分组、聚合

        5.数据可视化

# 统计每日用餐人数与销售额

#分析: 用餐日期   每日用餐人数  每日金额
import pandas as pd
#读取8月份订单表数据
order_info=pd.read_csv("C:/Users/Administrator/Desktop/data/meal_order_info.csv",encoding = "utf-8")
#读取1~7月份订单表数据
before_info=pd.read_csv("C:/Users/Administrator/Desktop/data/info_new.csv",encoding = "utf-8")
#合并为1~8月份订单数据
info_all = pd.concat([before_info,order_info])
#  筛选info_all表中  order_status 列的   值为1的数据
info = info_all[info_all['order_status'].isin([1])]
#info=info_all[info_all['order_status']==1]
#  索引重排列
info=info.reset_index(drop=True)
for i,k in enumerate(info['use_start_time']):
    y = k.split()
    y = pd.to_datetime(y[0])
    info.loc[i,'use_start_time'] = y
    
# 筛选  用餐日期   具体时间用餐人数  具体时间用餐金额    三列   根据日期(每天)进项分组,获取分组对象
groupby=info[['use_start_time','number_consumers','accounts_payable']].groupby(by='use_start_time')
#  根据分组  进行聚合   求出每日用餐人数总和   每日销售额  总和
sale_day=groupby.sum()
#  修改列名
sale_day.columns=['人数','销售额']
#  绘制折线图
import matplotlib.pyplot as plt
# 解决中文显示问题
plt.rcParams['font.sans-serif']=['SimHei']
plt.title("2016年1~8月份每日用餐人数折线图")
plt.xlabel('日期')
plt.ylabel('用餐人数')
plt.plot(sale_day['人数'])
plt.show()

 餐饮企业需求-数据准备_第1张图片

# 解决中文显示问题
plt.rcParams['font.sans-serif']=['SimHei']
plt.title("2016年1~8月份每日用餐销售额折线图")
plt.xlabel('日期')
plt.ylabel('销售额')
plt.plot(sale_day['销售额'])
plt.show()

 餐饮企业需求-数据准备_第2张图片

# 解决中文显示问题
plt.rcParams['font.sans-serif']=['SimHei']
plt.title("2016年1~8月份每日用餐人数与销售额折线图")
plt.xlabel('日期')

# 绘制每日人数折线图
plt.ylabel("人数", color="g")
plt.tick_params(axis="y", labelcolor="g")
plt.plot(sale_day['人数'], "g-", linewidth=2)

# 绘制每日销售额折线图
plt.twinx()
plt.ylabel("销售额", color="r")
plt.tick_params(axis="y", labelcolor="r")
plt.plot(sale_day['销售额'], "r-", linewidth=2)

# 展示
plt.show()

 餐饮企业需求-数据准备_第3张图片

 

你可能感兴趣的:(Python,python,开发语言)