模型评判与数据检验方法------R^2 t值 f 值

R^2  

       决定系数(coefficient of determination,R2)是反映模型拟合优度的重要的统计量,为回归平方和与总平方和之比。R2取值在0到1之间,且无单位,其数值大小反映了回归贡献的相对程度,即在因变量Y的总变异中回归关系所能解释的百分比。R2是最常用于评价回归模型优劣程度的指标,R2越大(接近于1),所拟合的回归方程越优,如下表,指数曲线的R2为0.9926,最接近1,表明在5个回归方程中,指数曲线(log(y) =1.9656-0.2199x)为最优方程。

                                                                        

           虽然R2可以用来评价回归方程的优劣,但随着自变量个数的增加,R2将不断增大,若对两个具有不同个数自变量的回归方程进行比较时,不能简单地用R2作为评价回归方程的标准,还必须考虑方程所包含的自变量个数的影响,此时应用校正的决定系数(R2-adjusted):Rc2,所谓“最优”回归方程是指Rc2最大者。因此在讨论多重回归的结果时,通常使用Rc2。

          这个式子式用1减去y对回归方程的方差(未解释离差)与y的总方差的比值,y减去y尖也就是残差,是拟合方程中不能解释的部分,用1减去不能解释的部分,那么剩下的就是解释的部分,也就是说自变量解释了因变量变动的百分比的多少,那么r方的值肯定是越大越好,意味着该模型把y的变动解释得好,R方的范围显然是0到1,在预测实践中,人们往往采纳R方最高的模型。

相关系数

                                                    模型评判与数据检验方法------R^2 t值 f 值_第1张图片

Corr(X,Y)= 1的时候,说明两个随机变量完全正相关,即满足Y=aX+b,a>0;考虑Corr(X,X),两个随机变量相同,肯定满足线性关系,此时,Cov(X,X)=Var(X),容易得到Corr(X,Y)=1;Corr(X,Y)= -1的时候,说明两个随机变量完全负相关,即满足Y=-aX+b,a>0; 0<| Corr(X,Y)|<1的时候,说明两个随机变量具有一定程度的线性关系。

t 检验

单总体检验

            单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著

            

双总体t检验

             双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。

   (1)配对样本t检验(两组样相减有意义)

   (2)独立样本t检验(两组样本相减无意义)

       配对和独立的区别:

        配对样本T检验:现在要分析人的早晨和晚上的身高是否不同,于是找来一拨人测他们早上和晚上的身高,这里每个人就有两个值,这里出现了配对,然后考虑每个人的早上和晚上身高的差,这样就可以构造一个T统计量分析了;独立样本T检验:现在要分析男生和女生的身高是否相同,于是找来一波男生女生,把男生们的平均身高减去女生们的,就可以构造T统计量。 两者的主要区别在于数据的来源和要分析的问题。

 

单总体检验

例子:https://blog.csdn.net/m0_37777649/article/details/74937242

理解好  单侧和双侧的“拒绝”的含义

 

你可能感兴趣的:(基础数学)