直线回归和相关------(五)直线回归与相关的内在关系和应用要点(回归系数相关系数关系推导)

一、内在关系

直线回归与相关的性质或方向(正或负)相同,显著性测验等价,说明两者之间存在着必然联系。两者有以下内在联系:

(1)相关系数是标准化的回归系数

    回归系数b是有单位的,但若对b作消去单位的标准化处理,即对b中x,y的离均差以各自的标准差 s_{x} 和 s_{y}为单位:

      \frac{\sum (\frac{x-\bar{x}}{s_{x}})(\frac{y-\bar{y}}{s_{y}})}{\sum (\frac{x-\bar{x}}{s_{x}})^{2} }=\frac{\sum (x-\bar{x})(y-\bar{y})}{s_{x}\cdot s_{y}}\cdot \frac{s_{x}^{2}} {\sum (x-\bar{x})^{2}}

                          =\frac{\sum (x-\bar{x})(y-\bar{y})}{\sqrt{\sum (y-\bar{y})^{2}}}\cdot \frac{\sqrt{\sum (x-\bar{x})^{2}}} {\sum (x-\bar{x})^{2}}

                          =\frac{\sum (x-\bar{x})(y-\bar{y})}{\sqrt{\sum (x-\bar{x})^{2}\sum (y-\bar{y})^{2}}}

                         =\frac{SP}{\sqrt{SS_{x}\cdot SS_{y}}}=r

      有时把相关系数称为标准回归系数。

(2)相关系数r是y依x的回归系数b_{y/x}和x依y的回归系数b_{x/y}的几何平均数

      对同一资料计算x依y的回归,则b_{x/y}=SP/SS_{y}:

              \sqrt{b_{x/y}\cdot b_{y/x}}=\sqrt{\frac{SP}{SS_{x}}\cdot \frac{SP}{SS_{y}}}=\sqrt{\frac{SP^{2}}{SS_{x}\cdot SS_{y}}}=\sqrt{r^{2}}=r

(3)线性回归方程也可用相关系数表示

              b_{y/x}=\frac{SP}{SS_{x}}=\frac{SP}{\sqrt{SS_{x}\cdot SS_{y}}}\cdot \frac{\sqrt{SS_{y}}}{\sqrt{SS_{x}}} =r\cdot \frac{s_{y}}{s_{x}}

             \hat{y}=\bar{y}+b(x-\bar{x})可改写为:\hat{y}=\bar{y}+r\cdot \frac{s_{y}}{s_{x}}(x-\bar{x})

(4)线性回归和 离回归的平方和也可用相关系数表示

            U=\frac{SP^{2}}{SS_{x}}=\frac{SP^{2}}{SS_{x}\cdot SS_{y} }\cdot SS_{y}=r^{2}SS_{y}

           Q=SS_{y}-U=(1-r^{2})SS_{y}

上述方法可以帮助我们理解回归的意义和X变数对Y作用的大小。在回归分析中引入统计数r是恰当的。

二、应用要点

回归分析和相关分析方法简单、结果直观,实践中出现不少误用或者对结果的不恰当的解释与推断。

(1)回归和相关分析要有学科专业知识作指导。

(2)要严格控制研究对象想(X,Y)以外的有关因素,在X,Y变化过程中尽量使其它因素保持稳定一致。

(3)直线回归和相关关系结果不显著,并不意味着X,Y没有关系,只说明X,Y没有显著的线性关系,并不能排除两变数间的存在曲线关系的可能性。

(4)一个线束r或b并不代表X,Y的关系一定是线性的,并不排斥能更好地描述X,Y的各种曲线的存在。

(5)虽然显著线性相关和回归并不意味着X,Y的真实关系就是线性,但在农学和生物学研究中要发现X,Y的真实曲线关系是相当困难的。X,Y一定区间内,用线性关系作近似描述是允许的,精确度至少要比用\bar{y}描述y变数有显著提高。研究结果的适用范围应加以限制,一般以观察区间为准。

(6)一个显著相关或回归并不一定具有时间上的预测意义。一般由X预测Y,|r|必须在0.7以上,此时Y的变异将有49%以上可以为X的变异说明。

(7)为了提高回归和相关分析的准取芯,两个变数的样本容量n(观察值对数)要尽可能大一些,至少有5对以上。同时,X变数的取值范围尽可能宽些,可降低回归方程的误差,也可及时发现X,Y间可能存在曲线关系。

你可能感兴趣的:(统计)