《深入浅出数据分析》读书笔记1 分解数据

我作为一个数学差的2B青年,十分渴望提高自己数据分析的能力,读了几章《深入浅出数据分析》感觉这本书是非常优秀的数据分析入门读物,接下来会在阅读的同时做笔记。

第一章 分解数据

数据分析的基本步骤为:

1确定问题:确定和了解问题。

2分解:数据分析就是分解问题和数据,使其成为更小的组成部分。

3评估:进一步对前两步了解到的情况作出各种结论。

4决策:把结论重新组合在一起,作出(建议)一个决策。


确定问题

要明确核心问题和目标,然后再进行分析。

除了运用图表阐述观点,同时需要解决问题和作出建议决策。

客户将帮助你确定问题,尽可能的从客户了解更多的信息,才能有助于确定问题。


分解(把问题和数据分解为更小的组块)

需要将问题划分为可管理、可解决的字块,问题常常是含糊不清的。

通过回答大问题分解出来的小问题,就可以找到大问题的答案。

进行有效的比较是数据分析的核心。


评估

评估组块的关键就是比较。

做出明确的假设,仔细阅读得到的数据和观察结果。

提出建议

作为数据分析师,需要让自己和客户仔细研究你的数据和评估,确保自己的意见传达到位,能简单则简单。

提交给客户的报告要以得到客户的理解,鼓励客户已数据为基础做出明智的决策为重点。

报告要简练、专业、直接了当。报告可按背景、数据解说、建议来撰写。


心智模型

心智模型会大大影响你对数据的解释。

所以要像对待数据一样严肃认真地对待心智模型。

统计模型取决于心智模型,你无法看到一切,因此你的大脑必须做出选择,以便集中注意力,这就是所谓的心智模型大大决定观察结果。

如果了解自己的心智模型,就会发现重点,开发最相关、最有用的统计模型。

统计模型取决于心智模型,如果用错了心智模型,分析就会胎死腹中。

而心智模型包括人们不了解的因素,一定要指出不确定因素,只要能明确不确定因素,就可以小心防范并想办法填补知识空白,继而提出更好的建议。

了解自己的知识缺陷非常重要。

原始数据

所获得的新数若未经任何处理,即称为原始数据,千万要保存原始数据,避免任何数据处理,必须能够将自己的工作结果与原始数据进行比较。

数据多往往是好现象,只需专注于目标即可。

深入挖掘数据

任务要明确,再进行深挖数据。


总结:这一章作者举了非常生动的例子,除了按照步骤去分析数据外,还要和自己的阴暗面斗争,即找到并坦白自己所不了解的知识,把他们罗列出来辅助分析,不让自己原有的心智模型影响客观分析。

你可能感兴趣的:(《深入浅出数据分析》读书笔记1 分解数据)