(29)数据分析

概念

1、含义

数据分析是数据和分析的结合,通过对数据统计处理分析出对业务有用的观点。其过程更加重视思维方法而非技术手段。技术只是实现目的的一种方法。因此相关人员的技术能力难以评判。数据分析一般在业务初创和改善时期十分有用。
其业务场景主要有:
(1)掌握业务,如核心指标通过漏斗数据和序列数据展示;可以通过报表看到数据变化情况,并分析为什么,是否存在问题
(2)改进业务,分析业务潜力和问题;是否有业务下滑和用户流失。
(3)评估某一策略的效果等。

2、准备

数据分析的需要的技能为:
(1)业务调研;通过调研得到分析思路和方向主题,如产品验证和启发思路。
(2)创新思考;需要广阔的知识面:经济学,心理学和统计学。
经济学,如分析电商财报,毛利很低,待付账单很大。
毛利低--消费者扩大--市场扩大--掌握供应商--分期付款--钱拿去做金融
(互联网中为用户创造价值和盈利往往不在一个领域,羊毛出在猪身上理论);
心理学,如便捷食品中有无洋葱案例,减少家庭主妇内疚感。
统计学,主要是算法了。
(3)逻辑推理;不同的背景和角度可能得到不同的结果,因此要全面。逻辑推理不等于因果关系推理,也不等于相关性关系。在分析中很可能因为错误归因(把相关关系认为是因果关系);比较对象选择失当;以及数据维度选择问题;先入为主的偏见;个例代表全体导致结果出错。
(4)可行性建议;一般的分析只是陈述事实;优秀的分析要分析优势,劣势,怎么办。

3、分析方法

(1)传统数据指标

传统数据指标包括概率表,直方图,均值,方差,标准差(衡量数据的散度)和相关性等。其基本理论支撑是大数定律。样本量越大,统计值越接近真实值。

(2)分析手段

在拿到数据后,从哪些角度开始分析呢。

1、指标拆分
<1>分布分析

数据指标可能在不同的数据分布中是相同的,无法真正表示数据。因此只关注指标而不关注数据是不行的。

<2>趋势分析

趋势分析包括:单变量趋势和多变量趋势
单变量趋势:通过周期,波动,异常值
多变量趋势:基于系统基模;抽象出增强环(各个节点循环促进),调节环(各个节点相互牵制最终平衡),以及考虑时间延迟性(某些改进可能并不是立即就会有明显效果)

<3>因素分析

因素分析可以进行多种拆解。
(1)根据流程的各个阶段进行纵向拆解,通过漏斗以及比例等发现问题。
(2)根据模块进行横行拆解。
如在买股票是判断公司股票是不是值得买。
首先从收入支出,资产负债等得到营业利润和总资产,相除得到资产回报率,可以反应企业的经营效率。再从营业利润和总资产中剥离出净利润和股东权益,得到固定权益回报率,从而判断值不值得投资。

2、样本拆分
<1>个例分析

一般来说,高层次的数据统计可能会难以发现隐含的问题。这个时候需要从典型个例来进行分析。如视屏点击率低的case,可以从点击率及其低(显著)的样本入手,然后看这一类在总量中占比;另一方面,选择数量多的案例进行分析;直到分析的样本包含整个数据集。

<2>异常分析

与预期不相符合就是异常。

<3>分组分析

小组化划分后数据的特征会更加鲜明,同时不同组的需求不相同,需要差异化个性化的服务。一般对于客户的划分可以从(大小,新老,行业)进行,因为他们需求不同。
(1)在用户增长领域,可以利用分组做留存分析,这个分组规则按照用户的使用程度划分,因为使用产品时间长度不一的用户一般来说流失的原因是不一样的。
(2)在价格歧视领域,可以对不同用户群或者客户群按其价格可承受程度分组,分别定价,如飞机票。

4、高级工具,OLAP与机器学习模型

<1>OLAP

分组分析与因素分析等结合,对数据切片、分块;钻取和上卷等。

<2>机器学习

1、非监督
(1)聚类:一般要分5类的话,先用算法分为10-20类,再通过人工聚合。因为人工可以知道哪些参数或者维度更为重要。
(2)关联规则
2、监督学习
选定假设空间从而选择模型,再进行模型训练

你可能感兴趣的:((29)数据分析)