《深入浅出数据分析》笔记二

检验你的理论

咖啡业的寒冬到了,连星巴仕咖啡店也在经历剧痛,在过去几个月里,实际销量与目标销量背道而驰,骤然下降。如下图:

《深入浅出数据分析》笔记二_第1张图片

市场部每个月会做一次客户调查,会对大量客户进行抽样调查,如下图的调查表

《深入浅出数据分析》笔记二_第2张图片

下图为2008年下半年市场调查汇总表,表中数字是各家分店参加调查的人对各个调查项给出的平均分

《深入浅出数据分析》笔记二_第3张图片

纵观这些数据,除了星巴仕咖啡价值这个变量,顾客对其他方面都感觉良好;看起来,星巴仕没有给人们物超所值的感觉,这可能是导致购买下降的原因。SoHo是一个富人区,也是几家利润丰厚的星巴仕分店的所在地,负责这几家分店的经理不相信这个问题的存在。

混杂因素就是研究对象的个人差异,它们不是你视图进行比较的因素,最终会导致分析结果的敏感度变差。上述案例的混杂因素是店址,我们需要将SoHo和其它分店分开,校正选址混杂因素。

接下来我们拆分数据块,管理混杂因素。下面我们再来看看星巴仕的调查数据,这一次将其它地区的数据列在相应的表格里。

《深入浅出数据分析》笔记二_第4张图片

在首席财务官的提示下,所以星巴仕分店的咖啡价格统统降低0.25美元,如下为销量情况

通过这个数据我们能知道星巴仕2月份降价比不降价多赚了多少吗?显示不能。因为销量数据都是来自3.75美元的咖啡售价,无法与假定数据——也就是4.00美元的咖啡售价产生的销售收入进行比较。这违背了比较法,好的是实验总是有一个控制组(对照组)

《深入浅出数据分析》笔记二_第5张图片

让我们重新做一次实验,这一次把所有星巴仕分店分成了控制组和实验组;实验组包括太平洋区所有分店,控制组包括SoHo区和东岸区所有分店

《深入浅出数据分析》笔记二_第6张图片

一个月后,你得到了下面的图

《深入浅出数据分析》笔记二_第7张图片


有混杂因素吗?有的

《深入浅出数据分析》笔记二_第8张图片

经过我们的思考,我们想到了四种分组方法,我们可以思考看看哪种分组比较适合

《深入浅出数据分析》笔记二_第9张图片

我们决定采用最后一个分组方法



《深入浅出数据分析》笔记二_第10张图片

在进行实验前,让我们最后再看一眼我们的整个程序,总结一下哪个策略最好。

《深入浅出数据分析》笔记二_第11张图片

结果在此,与其它两个组相比,价值游说组的日营业收入立即上升,而降价组的营业收入其实是与控制组持平。

《深入浅出数据分析》笔记二_第12张图片

你可能感兴趣的:(数据分析)