《深入浅出数据分析》读书笔记-第一部分

《深入浅出数据分析》通过模拟业务案例,结合统计知识,介绍了数据分析的分析过程,是一个很有帮助的数据分析入门指导书籍。

一.分解数据,挖掘信息

案例:结合Acome公司貌洁保湿霜的销量数据,提升保湿霜销量
知识点1:分析模型:确定——分解——评估——决策
分析过程如下:
1.确定问题
首先在明确本次数据分析的目标后,需要确定目标存在的问题。也可以说解决了这些问题,就能实现目标。如:
目标:提升保湿霜销量
问题:目前保湿霜销售存在什么问题?哪些地方可以提升销量?
方法:通常通过与客户的沟通,来明确这些问题。
2.分解
需要对目前掌握的数据和问题进行分解分析,将大问题化为小问题,从数据中寻找相关因子。
分解问题:将大问题分解为小问题

分解问题

除了针对问题分解,还可从知识点的角度,发散思维,穷尽问题相关可能性,然后结合实际的业务情况进行取舍,这样在分析问题时就有较为完善维度,减少遗漏问题的可能性。
.问题分解的过程需要我们发散思维,尽可能多的思考场景
发散思维

分解数据:将大数据化为小数据,小数据汇总成统计数据查看

3.评估
评估方法——“比较”,比较因果之间,因子之间,时间维度的比较,通常能发现一些数据规律。
下表“汇总数据”分析可以得出的结论:
1).12月/1月/2月,总销量与目标销量之间的差距较大
2).12月/1月/2月,降价对于目前销量的提升没有太大的作用
3).广告费的降低,可能带来了销量的下降;社会网络费增加并没有带来直观的销量增长。

汇总数据

通过数据表的评估分析,可能得出一个能提升销量的方法;但是需要结合实际的业务去评估,目前广告受众群体的市场占有率如何?是否都购买了貌洁保湿霜?

下表持续对销量明细数据分析发现:
1.泛美批发商的销量可观,但它与其他经销商的性质不同,详细分析发现它的市场客户群体与目前广告营销的客户群体不同,是男性客户群体。


明细数据

泛美公司销量明细数据

通过数据分析,提升销量的方法可能有两种:1.扩大对目前客户群体的广告投入 2.增大对男性客户群体的影响,可以是广告宣传或其他途径的宣传等。
4.决策
结合实际的业务情况,进行清晰明了的决策。

二.检验你的理论

案例:解决星巴仕公司销量下降的危机
知识点1:观察法——比较观察,排除混杂因素
知识点2:实验法——控制组,对比验证
1).通过用观察法,对比各区域及汇总数据,能发现:咖啡价值在非富人区明显下降,而在富人区不变

用户调研问卷数据

2).针对价值下降问题分析:
客户觉得咖啡现有的价格无法匹配当前的价值,有两个直观的方法:1.改变客户的观念,星巴仕的咖啡名副其实的 2.降价。
3).因为无法判断两种方法哪种更好,则需要做三组实验小组,分别采用不同的营销方法,来对比分析。而在实验样本小组的选择过程中,小组之间是相同性质的,以防止其他数据干扰实验的数据。
案例中的结论数据

三.寻找最大值

知识点:最优化问题,最大值
方法:
1找到决策变量(即你可以控制的因素)
2找到变量的约束条件(即决策变量受约束的条件)
3找到目标及目标函数
4罗列约束条件组合,求解目标函数(实际上运用Excel 的solver最优规划来实现计算)

案例:浴盆宝12月的橡皮鸭和橡皮鱼的生产计划,使企业的利润最大
求解过程如下:
已知约束条件:每只鸭利润$5,每只鱼利润$4,下个月最多生产400只鸭或300条鱼,橡皮的总供应量为50000g,每只鸭需要100g橡皮,每只鱼需要125g橡皮
决策变量为:橡皮鸭的数量,橡皮鱼的数量
目标:利润最大
方法:利用solver工具,如图所示(需要列出目标的计算公式,需求量大计算公式),得出结论
注意:上述的约束条件中未考虑橡皮鸭和橡皮鱼的市场销量情况,可以结合往年的历史销量数据预测橡皮鸭的销量,如果增加这个条件,则在solver 的约束条件中增加一行条件,如橡皮鸭小于50等

规划求解过程

四.数据图形化

案例:新军队优化网站的需求:如何从纷繁杂乱的数据中让信息脱颖而出
知识点1:散点图——利用散点图探索原因,分析因果关系
方法:
1.解决杂乱的数据的方法是:进行正确的比较。如本例中将影响目标的因素都进行清晰的对比
2.利用散点图,表达1个因素与目标之间的关系
3.当影响目标的因素较多时,这个时候可以运用多元散点图来表达。如下图:横轴表示因素影响,纵轴表示单一元素对页面间的影响

多元散点图

五.假设检验-证伪法

案例:预测podphone公司新手机的上市时间,为电肤公司的生产计划做准备
知识点1:相关关系网络图:分析多个因子之间及因子与结果之间的关系图
知识点2:假设检验法:核心是证伪(证明假设错误),若假设无法直接排除,则可借助诊断性找出否定最小的假设
方法:
1.可以利用外界的文字信息进行归纳整理,分析因子之间,因果之间的关系图,如下图。因果关系通常不是线性的,用这种网络正负关系图,能帮我们较快的梳理思路,

案例中的因子关系图

2.一般预测某一个结论,会先预设几个假设,结合目前掌握的证据,证明假设错误,就可以排除错误的假设。若假设无法排除,可基于证据的证明强弱对假设进行排序,选择最可能的假设条件作为预测结论,如下图所示。当然,若有新的证据进入,再次对假设条件作判断。


假设否定证据排序

3.假设检验的思路:
A:整理证据,分析证据链关系
B:假设条件
C:根据证据证伪,排除假设
D:无法直接排除,根据证据对假设的否定顺序排列,选择最可能发生的假设;或者寻找新的证件,做出新的判断。

你可能感兴趣的:(《深入浅出数据分析》读书笔记-第一部分)