《深入浅出数据分析》简记

深入浅出数据分析

chapter 1:分解数据

固定基本流程
  • 你对外界的假设和你确定的观点就是你的心智模型
  • 统计模型取决于心智模型
  • 心智模型可以通过经验进行试验

chapter 2:检验你的理论

  • 使用控制变量法通过比较来检验你的猜想/理论

chapter 3:最优化

  • 通过规划求解来求取最优模型
  • 模型的假设是基于不断变化的实际情况,所以要做好修改模型的准备,反复不断地进行构建模型正是分析师的工作

chapter 4:数据图形化

  • 散点图与散点图矩阵探索数据
  • 一些优化以及评估网站的点:网站布局、配色、字体、页面层次、关键字、停留时间、页面浏览次数、回头率

chapter 5:假设检验

  • 使用证伪法进行假设检验
  • 诊断性是证据所具有的的一种功能,能够对你评估所考虑的假设的相对似然。如果证据具有诊断性,就能帮助你对假设排序。

chapter 6:贝叶斯统计

  • 通俗易懂的讲解了贝叶斯公式

chapter 7:主观概率

  • 将主观的可能性用数值表示,以利于使用标准差等统计值来进行衡量

chapter 8:启发法

  • 启发法:
    • 1.(心理学定义)用一种更便于理解的属性代替一种难解的、令人困惑的属性。
    • 2.(计算机科学定义)一种解决问题的方法,可能会得出正确答案,但不保证得出最优化答案。
  • 使用快省树,快是指完成这个过程费时不多,省是指不需要大量的认知资源。

chapter 9:直方图

chapter 10:回归

  • 散点图
  • 平均值图
  • 相关性
  • 线性回归方程

chapter 11:合理误差

  • 内插法
  • 外插法
  • 机会误差(残差)
  • 分段函数

chapter 12:关系数据库

chapter 13:整理数据

附录提及的十大知识点:

  1. 统计知识大全
  2. Excel技巧
  3. Edward Tufte的图形原则
  4. 数据透视表
  5. R
  6. 非线性回归与多元回归
  7. 原假设-备择假设检验
  8. 随机性
  9. Google Docs
  10. 你的专业技能

你可能感兴趣的:(《深入浅出数据分析》简记)