最近抽空读了几本书,Head First系列的书还是比较亲睐的,最近刚出版的数据分析也没怎么犹豫就买回来看看。

整本书也就草草的翻了一遍,有点小失望,里面主要介绍的东西基本都是数据挖掘方向的东西,举了几个例子感觉有点简单,而实际问题比那个要复杂的多。但是如果只是看看原理,简单更能把问题说清楚。总体上来说,看完还是有点心得的,主要有以下几点:

1. 利用数据分析规律,从而得出结论。这个里面最重要的就是数据,包括怎么获得数据,怎么选取数据,怎么统计数据。就是找到关键因子建模。

2. 图形化数据。这是本书百试不爽的技巧,就是利用数据绘图,从而让这散列的数据顿时有了一定的规律,往往再利用点直觉就能更快的找到方向。

3. 证伪法——剔除无法证实的假设。这种方法可以避免根据直觉而得到的错误假设。

4. 多组相关的实验,最后利用结果的交集来得出结论,就是贝叶斯统计。

5. 根据模型仔细分析,让误差尽可能小。

说白了,就是让数据说话,让人们用更理性的方式去决策。但是实际操作起来,建模就是最大的问题,暂时还没想到这个怎么用起来去发掘一些潜在的东西。