线性回归拟合优度度量

在拟合了Y关于X的线性模型之后,我们不但想知道这种线性关系是否真的存在,还想度量模型对数据的拟合效果。拟合效果可以采用下面的方法之一进行度量,这些方法有很高的关联性。

 

1.Y对X的散点图、Y对Y的散点图

    Y与X之间线性关系的强度还可以通过考察Y对X或Y对Y\widehat{}的散点图和相关系数Cor(X,Y)(Cor(Y\widehat{},Y))的值直接度量。散点图上的点离一条直线越近(或Cor(X,Y)/Cor(X,Y\widehat{})越接近1、-1),Y与X(Y\widehat{})之间的线性关系越强。这个方法是不正规的且有主观性,但只需要线性假定。

   详细步骤见《例解回归分析》(原书第五版)(美)Samprit Chatterjee   Ali S.Hadi 著 (p36)

2.回归参数和相关系数的t检验

   X是否具备对Y的预测能力,一般可以通过相关系数和相应的Y对X的散点图来衡量。但是这只是一种视觉上的直观判断方法。现在提供一种更严格化的数量化方法:对回归参数\beta做假设检验。

   在模型中,若\beta=0意味着Y和X之间没有线性关系,若\beta!=0,则Y和X之间存在线性关系。因此对假设\beta=0做检验。前提是对于X的每一个固定的值,所有的\xi都相互独立,且都服从均值为0,方差为\sigma ^{2}的正态分布。

   详细步骤见《例解回归分析》(原书第五版)(美)Samprit Chatterjee   Ali S.Hadi 著 (p30)

3.R^{2}拟合优度样本决定系数

    R^{2}是一个拟合优度指数,表示的是响应变量Y的总离差平方和中能由预测变量X解释的比例。0<= R^{2}<=1,如果R^{2}接近1,说明Y的绝大部分变化可由X解释。因此,R^{2}称为决定系数,反应了预测变量对响应变量的解释能力。

   详细步骤见《例解回归分析》(原书第五版)(美)Samprit Chatterjee   Ali S.Hadi 著 (p37)

    

 

参考文献

   详细步骤见《例解回归分析》(原书第五版)(美)Samprit Chatterjee   Ali S.Hadi 著

 

 

你可能感兴趣的:(笔记,机器学习,人工智能)