@小蚊子乐园
其实我是犹豫了一段时间后才决定购买这本书的。因为觉得这本书太过于简单无趣,于是就直接去学习SPSS和SAS
。至于EXCEL,由于之前使用过,所以没太在意,特别是OFFICE 2010。因为之前认为OFFICE 2003可以解决大部分
的日常办公问题,而且现在用这软件的单位还不少,所以忽视了OFFICE 2010。事实上,OFFICE在实际工作中能提
供比OFFICE 2003强得多的感受。但是直接学习了SPSS和SAS之后又感觉好像学不到什么东西似的,不知道这两个
统计软件真正的用途是什么,更重要的是对于数据分析这一行业的彻底迷茫。我又看了很多统计学理论的书,但
是这些书里很多是复杂的数学公式,学起来很头大。我不知道自己选择往这行走是否正确,但又不甘心,只能蒙
着头走下去。我本来想通过网上下载的方式获得此书,但是一直没有得逞。现在想想,如果真的是通过PDF的形式
获取此书,可能只会浏览而已,不会真正用心去学习,更不会写这篇文章了。
我想,此书最大的意义在于对具体实践的解释,能把数据分析这一过程作为一个整体进行讲解。最重要的是介绍
了数据分析的基本思路,和实际操作的流程。各个过程中的注意事项也是本书的亮点,这些细节往往是非常重要
的,有很多启发意义。这本书对于初学者帮助很大,数据分析是一个大的整体,不像IT行业一样,可能只要精于
其中某一刻就行。数据分析要求对于相关技术和行业情况都有一定的了解才行,否则就无法入手了。在整体性方
面的讲解上,此书刚好填补了这块的空白。
最后,提一点建议。能不能提供一个数据分析学习体系的整体思路和相关推荐书籍。这可能会对今后进一步学习
和进行实践提供更大的帮助。(如果怕有什么问题可以私下发个我! )
附:我对于此书的要点总结:
第1章 数据分析那些事儿
1、 其实他们最主要的区别在于目的是否明确,如果目的明确,所有问题就自然迎刃而解了。
2、 一般来说,数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在 寻找模式与规律。
3、 比例是指在 总体中各部分的数值占全部数值的比重,常反映总体的构成和结构; 比率是指 不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
第2章 结构为王——确定分析思路
1、 逻辑树的使用三原则:
(1) 要素化:把相同问题总结归纳成要素。
(2) 框架化:将各个要素组织成框架,遵守不重不漏的原则。
(3) 关联化:框架内的各要素保持必要的相互关系,简单而不孤立。
第3章 无米难为巧妇——数据准备
第4章 三心二意——数据处理
1、 数据清洗:重复数据处理、缺失数据处理、检查数据逻辑错误;数据加工:数据抽取、数据计算、数据分组、数据转换;数据抽样。
第5章 工欲善其事必先利其器——数据分析
1、 数据分析方法的三大作用:现状分析、原因分析、预测分析。
作用 |
方法 |
数据分析方法 |
现状分析 |
对比 |
对比、平均、综合评价 |
原因分析 |
细分 |
分组、结构、交叉、杜邦、漏斗图、矩阵关联、聚类 |
预测分析 |
预测 |
回归、时间、决策树、神经网络 |
对比、分组、结构、平均、交叉、综合评分、杜邦、漏斗图、矩阵关联、高级数据分析方法。
2、 对比分析法:与目标对比、不同时期对比、同级部门、单位、地区对比、行业内对比、活动效果对比。
3、 分组法必须与对比法结合运用。
4、 结构分析法是指分析总体内各部分与 总体之间进行对比的分析方法。
5、 综合评价分析法的基本思想是将多个指标转化为 一个能够反映综合情况的指标来进行分析评价。
第6章 给数据量体裁衣——数据展现
1、 图表的作用:表达形象化、突出重点、体现专业化。
2、 数据间的关系:成分、排序、时间序列、频率分布、相关性、多重数据比较。
3、 图表制作五步法:
确定所要表达的主题或目的=》
确定哪种图表最适合你的目的=》
选择数据制作图表=》
检查是否真实有效地展示数据=》
检查是否表达了你的观点
4、 表格中突出显示单元格、项目选取、数据条、图表集、迷你图等几种展现数据的表格技巧。
5、 常用图表:平均线图、双坐标图、竖形折线图、瀑布图、帕累托图、旋风图、人口金字塔图、漏斗图、矩阵图。
第7章 专业化生存——图表可以更美的
1、 标题、图例、单位、脚注、资料来源这些图表元素是图表的五脏六腑。
2、 要注意的条条框框:
A 避免生出无意义的图表;
B 不要把图表撑破;
C 只选对的,不选复杂的;
D 一句话标题。
3、各个图表的注意事项
饼图 |
A 对于饼图要按照时钟表盘的刻度,把数据从 12 点钟的位置开始排列,最重要的成分紧靠 12 点钟的位置; |
B 数据项不要太多,保持在5项以内; |
|
C 不要使用爆炸式的“饼图分离”; |
|
D 饼图不要使用图例; |
|
E 尽量不要使用标签连线,如果要用则切记凌乱; |
|
F 尽量不适用3D效果,如果要用厚度要尽量薄一些; |
|
G 当扇区使用颜色填充时,推荐使用白色的边框线,具有较好的切割感。 |
|
柱形图 |
A 同一数据序列使用相同的颜色; |
B 不要使用倾斜的标签,别让读者歪着脑袋看; |
|
C 纵坐标轴一般刻度从0开始; |
|
D 一般来说,柱形图最好添加数据标签,这样让读者一眼就能看到具体数值; |
|
E 如果柱状图已经有了数据标签,纵坐标刻度线和网格线则显得多余了,最好删除。 |
|
条形图 |
A 同一数据序列使用相同的颜色; |
B 尽量让数据由大到小排序,方便阅读; |
|
C 不要使用倾斜的标签; |
|
D 最好添加数据标签。 |
|
折线图 |
A 折线选用的线型要相对粗些,最好比网格线、坐标轴更突出; |
B 线条一般不超过5条,否则像意大利面条,非常杂乱。如果线条太多的话可以分开做图表; |
|
C 不要使用倾斜的标签; |
|
D 纵坐标轴一般刻度从0开始。 |
4、 图表会说谎:a虚张声势的增长;b3D效果的伪装;c逆序排列的误导;d一维图形的障眼法。
5、 图表美化的三原则:简约、整洁、对比。
6、 美化图表的技巧:最大化数据墨水比、找出隐形的线、图表喜欢的数字格式、如何突出对比。
7、 数据墨水比最大化的步骤
A 去掉不必要的背景充填色;
B 去掉无意义的颜色分类;
C 去掉装饰性的渐变色;
D 去掉网格线、边框;
E 删掉不必要的图例;
F 去掉不必要的坐标轴;
G 去掉装饰性图片;
H 以上不能去掉的元素就尽量淡化;
I 对需强调的数据元素进行突出标识。
第8章 专业的报告——体现你的职场价值
1、 数据分析报告的作用:展示分析结果、验证分析质量、提高决策参考。
2、 数据分析报告种类:专题分析报告、综合分析报告、日常数据通报。
项目 |
word |
excel |
powerpoint |
优势 |
·易于排版 ·可打印装订成册 |
·可含有动态图表 ·结果可实时更新 ·交互性更强 |
·可加入丰富的元素 ·适合演示汇报 ·增强展示效果 |
劣势 |
·缺乏交互性 ·不适合演示汇报 |
·不适合演示汇报 |
·不适合大篇文章 |
适用 范围 |
·综合分析报告 ·专题分析报告 ·日常数据通报 |
·日常书记通报 |
·综合分析报告 ·专题分析报告 |
3、 数据分析报表由标题、目录、前言、正文、结论与建议、附录六大组成部分组成。
4、 撰写数据分析报告的五大注意事项:
A 合理的结构以及清晰的逻辑;
B 实事求是,反映真相;
C 用词准确,避免含糊
D 篇幅适宜,简洁有效;
E 结合具体业务进行合理的分析。
5、 标题常用类型:解释基本观点、概括主要内容、交代分析主题、提出问题。
6、 前言:为何要开展此次分析?有何意义?;通过此次分析要解决什么问题?达到何种目的?;如何开展此次分析?主要通过哪几方面开展?
7、 报告正文的特点:包含所有数据分析事实和观点、通过数据图表和相关的文章结合分析、正文各部分具有逻辑关系。
8、 撰写报告时的注意事项:
A 结构合理,逻辑清晰;
B 实事求是,反映真相;
C 用词准确,避免含糊;
D 篇幅适宜,简洁有效;
E 结合业务,分析合理。