大数据入门篇-朝阳医院2016年销售数据分析

大数据入门篇-朝阳医院2016年销售数据分析_第1张图片

朝阳医院2016年销售数据分析

本关学习内容:R语言第三章(知识点链接https://zhuanlan.zhihu.com/p/28610253)和第四章(知识点链接https://zhuanlan.zhihu.com/p/28610422),简单的数据处理和分析

实践项目:根据朝阳医院2016年销售数据.xlsx分析月均消费次数,月均消费金额,客单价,消费趋势。

实践项目的:学习和使用简单的数据处理和分析,巩固和实践所学的内容,加深理解简单处理数据处理和分析的过程。

做此项目的大致流程:读取excel数据(选用openxlsx来读取)->数据预处理->数据分析;其中数据预处理包括了列名重命名,删除缺失数据,处理日期,数据类型转换,数据排序等相关知识。

下面我们就来做此项目吧!

朝阳医院2016年销售数据.xlsx部分内容如下:

大数据入门篇-朝阳医院2016年销售数据分析_第2张图片

一:读取excel数据

1.下载安装openxlsx包和stringr包(R语言的字符串处理包)

2.读取excel数据

二:数据预处理

大数据入门篇-朝阳医院2016年销售数据分析_第3张图片

列名重命名后:

大数据入门篇-朝阳医院2016年销售数据分析_第4张图片

三:数据分析:

业务指标1:月均消费次数

月消费次数=消费的总次数/月数

注意:同一天同一个人购买所有消费次数当算作消费一次。

本例子以社保卡号和消费时间为切入点

大数据入门篇-朝阳医院2016年销售数据分析_第5张图片

结果如下:

大数据入门篇-朝阳医院2016年销售数据分析_第6张图片
大数据入门篇-朝阳医院2016年销售数据分析_第7张图片

业务指标2:月均消费金额

月均消费金额=总消费金额/月份数


大数据入门篇-朝阳医院2016年销售数据分析_第8张图片

业务指标3:客单价pct(per customer transaction)

客单价=总消费金额/总消费次数

大数据入门篇-朝阳医院2016年销售数据分析_第9张图片

业务指标4:消费曲线图

大数据入门篇-朝阳医院2016年销售数据分析_第10张图片

本关心得:多敲代码,多练习,多做项目,才会让基础更扎实!

                                                                                                                              十三西游记(公众号十三西游记) 

                                                                                                                                                     2017/08/18记

你可能感兴趣的:(大数据入门篇-朝阳医院2016年销售数据分析)