4、拟合

13、决定系数R2

既然用相关系数R了为什么还要有R2 ?

我们很难看出r=0.7和r=0.5的两倍一样好

但是我们很容易看出r2=1.4是r2=0.5的1.4倍

计算简单

计算

如图,计算老鼠重量的均值

计算差异值:var(mean)=sum(weight for mouse i - mean)2    平方使没有负值,正负不能抵消

把横坐标换成老鼠的大小,均值不变,var(mean)不变

问题:已知老鼠大小,用重量的均值是最好预测老鼠重量的方法吗?当然不是

我们可以根据数据拟合一条直线 ,这样只要知道老鼠的大小就可以预测重量。

那么,这个直线的预测的比均值更好吗?如果好,好多少?这时候就用r2 计算

首先,计算var(mean),然后计算var(line)

例子:

1、

大小和重量的关系占81%的变化

数据中81%的变化能由大小和重量的关系解释

2、两个不相关的数据

直线的变化比均值的变化少6%

总结:

r和r2 的关系

r2 比r更好用

r2 主要思想 

你可能感兴趣的:(4、拟合)