<行为科学统计>读书笔记 - 相关

1. 相关:

  • 定义:描述个体变量之间的关系
  • 意义:自己理解,x与y的变化关系.
  • 标记:使用r进行表示

2. 描述相关的要点

  • 正负:正相关,负相关
  • 相关形式:线性,非线性
  • 相关大小:接近1或者-1,越相关

3. 决定系数

  • r^2,描述了y的变异性可以由x的多少百分比进行决定
  • 与效应量的r^2(方差百分比)的含义类似
  • 方差百分比的含义:经过处理的效应(变异性),占未处理变异性的百分比.

4. 皮尔逊相关

  • 描述了两个变量间,线性的相关关系
  • 公式的含义: (XY的共同变化的程度) / (X,Y单独变化的程度)
  • 共同变化的程度,使用SP(离差积)
  • 单独变化的程度,使用SS
  • 算出的结果为r

4. 斯皮尔曼相关

  • 可以描述线性,非线性的相关
  • 原理: 将变量进行排序,相同变量使用一个序号.对排序之后的序号,使用"皮尔逊"相关.

5. 对于相关的迷思

  • 相关不等于因果:相关只是描述了两个变量之间有联系,但是没有解释变量之间为什么有联系
  • 相关的值受奇异值的影响
  • 相关的的值受到全距的影响
  • r描述了相关的大小,r^2描述了精准的预测

5. 相关的假设检验

  • 为什么要假设检验:当样本为非0相关时,看总体是否相关
  • 假设检验的目的:
    1. 接受H0: 样本的非0相关是由偶然引起的
    2. 拒绝H0: 样本的非0相关代表了总体的精确相关.
  • 如何假设检验: 拿到样本自由度df = n-2,α水平,查表得到相关范围.

6.总结

  • 相关的作用主要是预测,给回归提供可以可被解释变异性的百分比.
  • 异常值,非全距值,会改变相关
  • 相关不代表因果

你可能感兴趣的:(<行为科学统计>读书笔记 - 相关)