「销售订单excel物料」https://www.aliyundrive.com/s/8yihmUZPhWK
数据分析的三大作用:现状分析、原因分析、预测分析,现状分析可以表明当前的业务状况,对当前的业务状况做分析,可以给决策者提供一个数据支撑和参考。
本节使用一组销售订单明细数据,研究不同产品的订单数和销量情况,同时研究每个分拨中心的销量占比以及哪些月份订单量最多,综合数据分析的结果给业务决策热提供数据支持。
查看订单量前十的产品都有哪些?使用value_counts()函数进行分组计数,默认是降序排列,同时使用head函数选取前十个数据结果,其中充电宝订单数排第一位。
数字不太直观,我们导入matplotlib包将订单量可视化进行展示。
value_counts函数是默认降序排列,可以使用sort_values函数升序排列后,使用plot.barh函数做一个条形图,由图可以看出订单数排前十的产品,且贴膜和数据线这两款产品之间订单数出现显著差异。
查看销售量前十的产品,按照产品名称分组求和,然后使用sort_values函数设置ascending=False参数进行降序排列。
使用条形图直观地展示数据结果,手机壳的销量排第一位,表明手机壳更新换代速度比较快,产品需求多。
每款产品都是由分拨中心始发,查看每个分拨中心中心的销量占比,使用groupby函数根据发货地分组求和,同时除以总销量,即可得到每个分拨中心的销量占比。
使用plot.pie函数绘制一个饼图,由图可以看出上海分拨中心的的销量占比最高,达到37.89%,郑州分拨中心的销量占比最低,仅有11.38%。
查看哪些月份的订单最多,这里筛选2018年1月1日到2018年12月31日的数据,同时使用map和lambda函数提取年月,将提取的年月数据格式变化为字符类型。
使用dtypes函数查看数据类型,可以看到初始的订单日期为日期类型,提取后的月份字段变为字符类型。
计算每个月的订单数,按照月份进行分组计数,其中nunique函数可以实现非重复计数功能。
使用plot函数绘制一个折线图,由图可以看出2018年12月的订单数最多,2018年2月份的订单数最少。
文章节选大话数据分析公共账号,并编辑。