常用的数据分析方法有:1、对比分析法;2、分组分析法;3、结构分析法;4、留存分析法;5、交叉分析法;6、漏斗分析法;7、矩阵分析法;8、象限分析法;9、趋势分析法;10、指标分析法;11、综合评价分析法。其中“对比分析法”是对数据进行比较以分析数据间的差异,包括静态比较和动态比较。
即比较分析法,对数据进行比较以分析数据间的差异,包括静态比较和动态比较。静态比较又称横向对比,在同一时间下对不同指标进行的对比;动态比较也称纵向对比,是在同一总体条件下对不同时期指标数值进行的比较。目的是揭示数据代表的事物的发展变化和规律性。
横向对比:横向对比就是跟自己比。最常见的数据指标就是需要跟目标值比,来回答我们有没有完成目标;跟我们上个月比,来回答我们环北增长了多少。
纵向对比:简单来说就是跟他人比。我们要跟竞争对手比,来回答我们在市场中的份额和地位是怎样的。
结合对比法,把总体中不同性质的对象分开,并进行对比以便了解内在的数据关系。
亦称比重分析,分析总体内各组成部分占总体的比例以及构成的变化,从中掌握事物的特点和变化趋势。
留存分析法是一种用来分析用户参与情况和活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。从用户的角度来说,留存率越高就说明这个产品对用户的核心需求也把握的越好,转化成产品的活跃用户也会更多,最终能帮助公司更好的盈利。
比如,我们可以通过观察不同时间段用户留存的情况,通过对比各个渠道、活动、关键行为的用户后续留存变化,发现提升用户留存率的影响因素,例如观察领取过优惠券的用户留存率是否比没有领取优惠券的用户留存率更高。
即立体分析法,常用于分析变量之间的相关关系。将不同维度数据交叉展现,进行多角度结合分析的方法。
对比分析既有横向对比,又有纵向对比。如果既想横向对比,又想纵向对比,就有了交叉分析法。交叉分析法就是对数据从多个维度进行交叉展现,进行多角度的结合分析。在分析app数据的时候,通常会分ios和安卓来看。交叉分析的主要作用就是从多个维度细分数据,从中发现最为相关的维度来探索数据变化的原因。
结合对比、分组分析法,可以比较同一环节优化前后效果、不同用户群转化率,同行类似产品的转化率。反映用户行为状态以及从起点到终点各阶段用户转化情况,常用转化率和流失率两个指标。
即矩阵关联分析法,以事物的两个重要属性为分析的依据,进行分类关联分析,为解决问题和资源分配提供参考依据。
依据数据的不同,将各个比较主体划分到4个象限中。如果把智商和情商进行划分,就可以划分为两个维度四个象限,每个人都有自己所属的象限。一般来说,智商保证一个人的下限,情商提升一个人的上限。
一个之前实际工作中用过的象限分析法的例子。一般p2p产品注册用户都是有第三方渠道引流的,如果按照流量来源的质量和数量可以划分四个象限,然后选取一个固定时间点,比较各个渠道的流量性价比,质量可以用留存的总额这个维度作标准。对于高质量高数量的渠道继续保持,对于高质量低数量的渠道扩大引入数量,低质量低数量pass,低质量高数量尝试一下投放的策略和要求,这样的象限分析可以让我们在对比分析的时候得到一个非常直观和快捷的结果。
当数据很多,而我们又想从数据中更快、更便捷来发现数据信息的时候,这个时候需要借助图形的力量,所谓图形的力量,就是借助EXCEl或者其他画图工具把他画出来。
趋势分析一般用于核心指标的长期跟踪,比如:点击率、GMV、活跃用户数。一般做成简单的数据趋势图,但光制作成数据趋势图还不算分析,必须像上面一样,数据有那些趋势上的变化,有没有周期性,有没有拐点,并分析背后的原因,无论是内部原因还是外部原因。趋势分析最好的产出是比值。有环比、同比、定基比。比如2017年4月份比3月份GDP增长了多少,这就是环比,环比体现了最近变化的趋势,但有季节性的影响。为了消除季节性的影响,推出了同比,比如:2017年4月份比2016年的4月份GDP增长了多少,这就是同比。定基比就更好理解,就是固定某个基点,比如将2017年1月份的数据作为基点,定基比则为2017年5月份的数据和2017年1月份的数据做对比。
在实际工作中,当拿到一些可视化数据图表或者是Excel表格时,我们可以直接运用统计学中的一些基础指标来做数据分析,比如平均数、众数、中位数、最大值、最小值等,下面我们分别来介绍:
平均数、也叫平均分析法,是指运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平的分析方法。平均分析法常用指标有算术平均数、调和平均数、几何平均数、众数和中位数等,其中最为常见的是算术平均数,也就是日常所说的平均数或平均值。
平均数指标可用于对比同类现象在不同地区、不同行业、不同单位等之间的差异程度,比用总量指标对比更具说服力。除此以外,利用平均指标对比某些现象在不同历史时期的变化,也更能说明其发现趋势和规律。
众数也就是数据中的一种代表数,它反应的是数据的一种集中程度。比如说最佳,最受欢迎,最满意都与众数有关。众数本质上来说,反映的是数据中发生频率最高的一些数据指标,在做数据分析时,我们可以对这些数据指标提取一些共性的特点,然后进行提炼和总结,然后得出一些改进的意见。
中位数主要是反映的是一组数据的集中趋势,像我们比较常见的正态分布,比如说我们想去统计某市的人均收入,其实,大部分的人均收入都是在一定范围之内的,只有少部分是处于最低的和最高的,其实这是中位数带来的意义。
在做数据分析时,如果各个数据之间的差异程度较小,用平均值就有较好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代表性。
最大(小)值在平时做数据分析工作时比较常见,只是我们没有特别去注意。最值是作为典型代表和异常值进行分析的,比如说销售团队里的销售冠军,电商爆款商品等。
将多个指标转化为一个能够反映综合情况的指标来进行评价,如企业经济效益评价。包括主成分分析法、数据包络分析法、模糊评价法等。