大数据分析项目实战--天猫订单综合分析

天猫订单综合分析

分析订单转化率、销量趋势、地域分布统计等。

文章目录

  • 天猫订单综合分析
    • 一、数据背景
    • 二、分析目的
    • 三、读取数据
      • 导入相关包
      • 读取并查看数据
    • 四、处理数据
      • 规范字段名称
      • 重复值与缺失值
    • 五、数据分析
      • 订单转化率
      • 总体转化率
      • 整体订单数趋势
      • 销量区域分布统计

一、数据背景

本数据集共收集了发生在一个月内的28010条数据,字段包含以下:
大数据分析项目实战--天猫订单综合分析_第1张图片

  1. 订单编号:订单编号
  2. 总金额:订单总金额
  3. 买家实际支付金额:总金额 - 退款金额(在已付款的情况下)。金额为0(在未付款的情况下)
  4. 收货地址:各个省份
  5. 订单创建时间:下单时间
  6. 订单付款时间:付款时间
  7. 退款金额:付款后申请退款的金额。如无付过款,退款金额为0

二、分析目的

订单每个环节的转化转化率
订单成交的时间(按天)趋势(按实际成交)
订单数在区域上的分布统计

三、读取数据

导入相关包

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import os
import warnings
warnings.filterwarnings('ignore')

读取并查看数据

path = r'E:/pycharm_workspace/pythonWeb/datas/tmall_order_report.csv'
df = pd.read_csv(path,engine = 'python',encoding = 'utf')
print(df.head(1))
print(df.tail(1))
print(df.columns)

大数据分析项目实战--天猫订单综合分析_第2张图片

四、处理数据

规范字段名称

# 将字段名称中空格去掉,规范字段名称
df=df.rename(columns={'收货地址 ':'收货地址','订单付款时间 ':'订单付款时间'})
print(df.columns)
print(df.info())

在这里插入图片描述
大数据分析项目实战--天猫订单综合分析_第3张图片

重复值与缺失值

print(df.duplicated().sum())    #重复值
print(df.isnull().sum())        #缺失值

大数据分析项目实战--天猫订单综合分析_第4张图片

五、数据分析

订单转化率

  • 计算每个环节的数据
  • 将得到如下的数据: [[‘总订单数’, ‘28010’], [‘付款订单数’, ‘24087’], [‘到款订单数’, ‘18955’],
    [‘全额到款订单数’, ‘18441’]]

1.买家实际支付金额:总金额 - 退款金额(在已付款的情况下)。金额为0(在未付款的情况下)
2.退款金额:付款后申请退款的金额。(如无付过款,退款金额为0)

dict_convs = dict()

key = '总订单数'
dict_convs[key] = len(df)
#print(len(df))

key = '付款订单数'
# 付款时间不为空的,表示付过款
df_payed = df[df['订单付款时间'].notnull()]
dict_convs[key] = len(df_payed)
#print(len(df_payed))

key = '到款订单数'
# 买家实际支付金额:总金额 - 退款金额(在已付款的情况下)
# 买家实际支付金额不为0的,说明订单商家收到过款
df_trans = df_payed[df_payed['买家实际支付金额'] != 0]
dict_convs[key] = len(df_trans)
#print(len(df_trans))

key = '全额到款订单数'
# 在付款的订单中,退款金额为0的,说明没有退款,表示全额收款
df_trans_full = df_payed[df_payed['退款金额'] == 0]
dict_convs[key] = len(df_trans_full)
#print(len(df_trans_full))
print(dict_convs)
df_convs = pd.Series(dict_convs,name = '订单数').to_frame()
print(df_convs)

在这里插入图片描述
大数据分析项目实战--天猫订单综合分析_第5张图片

总体转化率

# 添加总体转化率,每个环节除以总订单数
name = '总体转化率'
total_convs = df_convs['订单数']/df_convs.loc['总订单数','订单数']*100
df_convs[name] = total_convs.apply(lambda x : round(x,0))
print(df_convs)

大数据分析项目实战--天猫订单综合分析_第6张图片

整体订单数趋势

# 总体订单趋势
# 按到款订单统计
df_trans['订单创建时间'] = df_trans['订单创建时间'].astype('datetime64')
df_trans=df_trans.set_index('订单创建时间')
#print(df_trans.head(1))
se_trans_month = df_trans.resample('D')['订单编号'].count()
#print(se_trans_month)
se_trans_month.plot()
plt.show()

大数据分析项目实战--天猫订单综合分析_第7张图片

销量区域分布统计

# 销售区域分布统计
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei']
se_trans_map = df_trans.groupby('收货地址')['收货地址'].count().sort_values(ascending = False)
plt.figure(dpi = 100)
se_trans_map.plot(kind = 'bar')
plt.show()

大数据分析项目实战--天猫订单综合分析_第8张图片

你可能感兴趣的:(大数据分析项目实战--天猫订单综合分析)