问卷调查是了解客户反馈意见的一个好工具。除了从单一维度分析客户想法之外,对不同题目进行交叉分析,更容易挖掘出有用的信息。
下面用案例来手把手讲解单选题和多选题的交叉占比分析怎样做。
01 单选题交叉占比分析
比如有如下案例,调查了不同客户的存款期限和客户职业,如何分析二者之间的交叉关系呢?
步骤1,对选项进行数字化编码
按照如下的编码关系,使用vlookup函数将原字母的选项进行数字化编码。
数字化编码后,结果就像下面这样。
然后将所有的数字复制粘贴为值的形式,方便后面的分析。
步骤2:对两个选项进行单因素方差分析。
开展单因素方差分析的原因是检验两个选项是否存在显著性差异。如果差异性大,则对两个选项开展交叉分析具有统计学上的意义。不过在实际工作中,如果确实需要分析对应选项之间的交叉情况,则无需关注显著性检验结果。
开展单因素方差分析的方法是,选择excel表的数据-数据分析,在弹出窗口选择“方差分析:单因素方差分析”。
在弹出窗口选择输入区域和输出区域(其它默认),就会看到计算出的两张表格。
在这两张表格中,重点是看第二张表格的P-value(显著性)。当P-value小于0.05时通过检验,表明组间差异明显,交叉分析效果明显,反之效果较差。
步骤3:开展组间交叉分析
终于到了最关键的步骤。这里要插入“数据透视表”。数据区域选择存期和客户职业对应区域。将“存期”在列,将“职业”放在行,将“存期”放到值,其中值汇总方式选择为“计数”,值显示方式选择为“行汇总的百分比”。就像下面这样。
这样一份单选题的交叉占比分析表就计算完成了,结果如下:
从上表可以很方便的看出,职业为机关的客户存期集中在13月和25月,职业为商业的客户,存期集中在13月和37月,后面以此类推。
02 多选题交叉占比分析
上面分析了单选题之间的交叉分析方法。但如果是多项选择题,每个选项不是唯一的,并不能简单地进行交叉,那又怎样来进行分析呢?
仍然以一个案例来进行讲解。下面假设客户存款是多选,年龄是单选,客户爱好是多选,怎样进行两两交叉分析呢?
步骤1:多选项分列
为了后续的交叉分析方便,这里对选项的录入不是采用0/1的计数方法,而是直接录入选项。
以选项1“存期”为例来讲解。
因为此项选择最多能选3项,所以目标就是将选项分为3列。分列方法是选择要分列的区域,点击excel表的数据-分列,选择“固定列宽”,建立分列线。这样多选项就分列为单项选择。
接下来要将分列后的空白的项填充为0,使用“替换”功能就可实现。填充为0是为了后面的统计需要。结果就像下面这样:
步骤2:字母编码为数字
方法同上文所述,结果像这样。
为了实现选项1和选项2交叉分析,选项2也要构造为和选项1同样的维度,像下面这样:
步骤3:无重复双因素方差分析。
为了检验组间的差异性,可以进行方差分析。如果业务需要,也可以略过这步。
步骤4:选项之间的交叉分析
因为是多选题之间交叉分析,所以没有办法使用数据透视表来做。这里使用countifs函数,根据行和列的条件进行频数统计。结果像下面这样:
根据每行的合计数,就可以算出交叉占比,像下面这样:
解释方法也同单选题的交叉占比分析方法。另外的选项交叉分析也是如上所述的同样原理。
以上就逐一讲解了单选题和多选题的交叉占比分析方法。通过从多维度的视角深挖数据之间的隐藏信息,相信能给做数据分析的你带来更多的收获。
如果喜欢请点赞,还可以关注公众号:科技爸遇到文艺妈,获取更多技术干货。