# 导入数据源
import pandas as pd
data = pd.read_csv(r'/Users/faye/Desktop/order-14.3.csv',parse_dates= ['成交时间'])
- 分析哪类别商品畅销
data.groupby('类别ID')['销量'].sum().reset_index().sort_values(by = '销量',ascending = False).head(10)
- 不同门店的销售额占比
data['销售额'] = data['销量'] * data['单价']
data.groupby('门店编号')['销售额'].sum()
# 绘制饼图
(data.groupby('门店编号')['销售额'].sum() / data['销售额'].sum()).plot.pie()
# 自定义时间格式函数strftime提取小时数
data['小时'] = data['成交时间'].map(lambda x : int(x.strftime('%H')))
# 对小时和订单去重
traffic = data[['小时','订单ID']].drop_duplicates()
# 绘制每小时客流量折线图
traffic.groupby('小时')['订单ID'].count().plot()