数据分析入门

1、数据问题的处理流程:

    一般的数据分析都是先从公司的具体业务问题出发,提出解决什么样的具体的业务问题,然而对于一般的业务问题提出来时都是比较抽象的,如“如何提高xx产品的销售量?”。对于抽象的业务问题,我们首先要做的就是把问题分解成具体的小问题,然后针对各个小问题分别取获取相应的数据来做具体分析。这些具体的数据来源一般包括从上级的邮件、公司的各项业务数据、运营数据、基础设施数据等。针对具体的问题建好模型后,需要对各模型进行评估,而评估的方式有很多种,可以组织观察研究法来分析模型结果是否合理,也可以用控制组实验法来验证。对于可行的数据模型,可以用来预测一定的业务数据从而帮助上级决策。

 数据分析入门_第1张图片

   

 

2、数据处理流程:

针对具体的探索性数据问题,对数据的处理一般按照如下图的流程。对于一开始就只存在一堆数据而无任何探索性方向的情况是很少的,几乎没有。就算是做数据挖掘,也一定有一个探索的方向和问题,也就是带有一定的目的(比如说你想看看这些变量之间的关系),但在这个过程中,可能发现一些令人诧异的模式,如“啤酒喝尿布模式”,而这些模式可能是你预先没有想到的。

最重要的备份原始数据---避免原始数据丢失;

最麻烦的是数据的准备---清洗、转化、整理;

最终的目的是得到一个合理的模型----最好可以在更新数据时能自动学习,自主构建模型,使模型可以重复使用。

 数据分析入门_第2张图片

 

 

3、数据分析中最重要的一点就是----数据的对比,可以说是数据分析的核心,有对比才能看出模式。在这个数据泛滥的时代,我们很难把所有数据都拿来对比,但程序可以,也许这就是算法为什么这么重要的原因。

 

4、数据分析另一个重要的是要学会反向思考----从假设检验我们就可以知道,你们不能用99%的证据证明它是对的,但你可以用99%的证据来拒绝它,这种思考方式是很值得学习的。

 

5、给出一个合理的模型时要注意:1)给出模型的具体内容;2)给出适应的范围;3)给出模型存在的误差。


6、参考的书籍:《菜鸟也会数据分析》、《深入浅出数据分析》





你可能感兴趣的:(数据分析,数据分析流程,数据处理流程)