统计咨询:决定系数(R方)是否越大越好?

统计咨询:决定系数(R方)是否越大越好?

原作者@一起学统计工具, 转自搜狐, 侵删.
问题:尊敬的老师您好,想问一下决定系数R2越大越好,但是有没有说具体的范围?大于多少就是有意义的?谢谢老师。

回复:决定系数(coefficient of determination,R2)是反映模型拟合优度的重要的统计量,为回归平方和与总平方和之比。R2取值在0到1之间,且无单位,其数值大小反映了回归贡献的相对程度,即在因变量Y的总变异中回归关系所能解释的百分比。R2是最常用于评价回归模型优劣程度的指标,R2越大(接近于1),所拟合的回归方程越优,如下表,指数曲线的R2为0.9926,最接近1,表明在5个回归方程中,指数曲线(log(y) =1.9656-0.2199x)为最优方程。

统计咨询:决定系数(R方)是否越大越好?_第1张图片
虽然R2可以用来评价回归方程的优劣,但随着自变量个数的增加,R2将不断增大,若对两个具有不同个数自变量的回归方程进行比较时,不能简单地用R2作为评价回归方程的标准,还必须考虑方程所包含的自变量个数的影响,此时应用校正的决定系数(R2-adjusted):Rc2,所谓“最优”回归方程是指Rc2最大者。因此在讨论多重回归的结果时,通常使用Rc2。

至于R2大于多少才有意义呢?这时我们可以看另外一个指标:复相关系数(Multiple correlation coefficient)R,R是决定系数R2的平方根,可用来度量因变量Y与多个自变量间的线性相关程度,即观察值Y与估计值之间的相关程度。我们可以参考《MedCalc常用统计分析教程》一文:
统计咨询:决定系数(R方)是否越大越好?_第2张图片
相关系数要在0.7~0.5才有意义,因此,R2应大于0.5*0.5=0.25,所以有种观点认为,在直线回归中应R2大于0.3才有意义。

你可能感兴趣的:(理论知识)