python-绘图,loc函数,enumerate() 函数

1.数据处理:

  • 导入需要用的包和数据
  • 取文件中需要用到的几列
  • 列重命名
  • 将日期字段转为datetime,筛选时间范围
  • 做sum

2.loc函数

  • 根据列中的元素,选取对应元素的数据集 
  • 根据元素的选取条件来选取对应的数据集 
  • 根据元素的选取条件来来选取对应的数据集,并在符合条件的数据行添加flage标签 
import os
import sys
import pandas as pd
from datetime import datetime, date
from time import time,localtime,strftime
import matplotlib.pylab as plt

dir_path = 'E:\\Data\\'
wdata = pd.read_csv(dir_path+'order_jx_y3',sep='\x01',encoding='utf-8',header=None)
wdata = wdata[[1,2,3,4,5]] #取所需列
wdata.columns = ['province','city','sku','sku_qty','date'] #给列命名
wdata['date2'] = pd.to_datetime(wdata.date) #将日期列转为datetime

#print(type(wdata['date2']),type(wdata['date']))
#print(type(wdata.date.iloc[0]),type(wdata.date2.iloc[0]))

wdata['day'] = pd.to_datetime(wdata.date2).dt.dayofweek #新建列,显示日期对应的是星期几
mask = (wdata['date2'] > '2016-12-31') & (wdata['date2']< '2018-01-01') #标记1.选择时间范围
mask1=(wdata['day']==1)  #标记2,取星期一的数据
g1 = wdata.loc[mask & mask1] #取两个标记对应的数据
'''
也可以写成
mask = (wdata['date2'] > '2016-12-31') & (wdata['date2']< '2018-01-01')
&(wdata['day']==1)
g1 = wdata.loc[mask]
'''
plot_data = g1[['sku_qty','date2']].groupby(['date2']).sum()  #取销量和日期字段,按日期分组求每个星期一的总销量
plot_data = plot_data.reset_index() #重置索引

python-绘图,loc函数,enumerate() 函数_第1张图片

3.enumerate() 函数

enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。

数据处理:

  •      取省份、销量、日期字段,做sum计算
  •      将结果集按省份和日期排序
  •      将省份列去重转为列表,并循环——这么做的原因是,想要在图中展示每个省份在每个周一的销量,每根线代表一个省份
plot_data = g1[['province','sku_qty','date2']].groupby(['province','date2']).sum()
plot_data = plot_data.reset_index()
plot_data = plot_data.sort_values(by=['province','date2'])

#plot_data.head(5)
province_list = plot_data['province'].drop_duplicates().tolist()
for i, province in enumerate(province_list):
    mask_plot = plot_data['province'] == province
    plt.plot(plot_data['date2'].loc[mask_plot],plot_data['sku_qty'].loc[mask_plot])
#p = plot_data.groupby(['date2']).sum()
#plt.plot(p.index,p['sku_qty'])
plt.show()

python-绘图,loc函数,enumerate() 函数_第2张图片

 

每个城市的销量情况,每根线是一个城市

for i, city in enumerate(city_list):
    mask_plot = plot_data['province'] == city
    plt.plot(plot_data['date2'].loc[mask_plot],plot_data['sku_qty'].loc[mask_plot])
p = plot_data.groupby(['date2']).sum()
plt.plot(p.index,p['sku_qty'])
plt.show()

python-绘图,loc函数,enumerate() 函数_第3张图片

你可能感兴趣的:(每天一点Python)