前言
本文主要介绍了一元线性回归模型的数学模型,回归参数估计,三种显著性检验( F F 检验, R2 R 2 判定系数,估计标准差),并给出了使用最小二乘法推导回归参数的详细过程。
1, 数学模型
假设 Y=a+bX+ϵ Y = a + b X + ϵ ,其中:
X X 是可控变量;
Y Y 是随机变量
a+bX a + b X 是 Y Y 随着 X X 变化而线性变化的部分;
ϵ ϵ 是随机误差,它是其他的一切微小的,不确定的影响因素的总和,其值具有不可观测行,通常假定 ϵ∼N(0,σ2) ϵ ∼ N ( 0 , σ 2 ) 。
函数 f(X)=E(X|Y)=a+bX f ( X ) = E ( X | Y ) = a + b X 称为一元线性回归函数,其中:
- a a 为回归常数, b b 为回归系数, a a 和 b b 统称为回归参数;
- X X 为回归自变量;
- Y Y 为回归因变量。
假定 (x1,y1),(x2,y2,⋯,(xn,yn)) ( x 1 , y 1 ) , ( x 2 , y 2 , ⋯ , ( x n , y n ) ) 是 (X,Y) ( X , Y ) 的一组观测值,则一元线性模型可以表示为
yi=a+bxi+ϵi,ϵi∼N(0,σ2),i=1,2,⋯,n(8))(1) (1) (8) y i = a + b x i + ϵ i , ϵ i ∼ N ( 0 , σ 2 ) , i = 1 , 2 , ⋯ , n )
其中,各 ϵi ϵ i 相互独立。
2, 回归参数的估计
使用最小二乘原理,估计回归参数 a a 和 b b ,使得误差平方和 ∑i=1nϵ2=∑i=1n(yi−a−bxi)2 ∑ i = 1 n ϵ 2 = ∑ i = 1 n ( y i − a − b x i ) 2 最小,
即: Q(a,b)=∑i=1n(yi−a−bxi)2 Q ( a , b ) = ∑ i = 1 n ( y i − a − b x i ) 2 取最小值。
求 Q Q 关于 a a 和 b b 的一阶偏导数,并使它们为0,解得 b b 的最小二乘估计为:
b=∑i=1n(xi−x¯¯¯)(yi−y¯¯¯)2∑i=1n(xi−x¯¯¯)2=LxyLxx(9)(2) (2) (9) b = ∑ i = 1 n ( x i − x ¯ ) ( y i − y ¯ ) 2 ∑ i = 1 n ( x i − x ¯ ) 2 = L x y L x x
其中:
- x¯¯¯=1n∑i=1nxi x ¯ = 1 n ∑ i = 1 n x i
- y¯¯¯=1n∑i=1nyi y ¯ = 1 n ∑ i = 1 n y i
- Lxy=∑i=1n(xi−x¯¯¯)(yi−y¯¯¯)2 L x y = ∑ i = 1 n ( x i − x ¯ ) ( y i − y ¯ ) 2
- Lxx=∑i=1n(xi−x¯¯¯)2 L x x = ∑ i = 1 n ( x i − x ¯ ) 2
这样, b b 和 a a 的最小二乘估计可以写成
{b^=LxyLxxa^=y¯¯¯−b^x¯¯¯(3) (3) { b ^ = L x y L x x a ^ = y ¯ − b ^ x ¯
在得到
a^ a ^ 和
b^ b ^ 后,称
Y^=a^+b^X Y ^ = a ^ + b ^ X 为一元回归方程。
通常取参数 σ2=1n−2∑i=2n(yi−a^−b^xi)2 σ 2 = 1 n − 2 ∑ i = 2 n ( y i − a ^ − b ^ x i ) 2 为参数 σ2 σ 2 的估计(最小二乘估计),并且是无偏估计。
3,回归方程显著性检验
对于一元回归方程进行检验等于检验
H0:b=0H1:b≠0 H 0 : b = 0 H 1 : b ≠ 0
3.1 平方和的分解
为寻找检验 H0 H 0 的方法,将 X X 对 Y Y 的线性影响与随机波动引起的变差分开,变差的大小用实际观察值 y y 与其均值 y¯¯¯ y ¯ 之差 y−y¯¯¯ y − y ¯ 来表示。
而n次观察值的总变差可由离差的平方和 SST S S T 来表示
SST=∑i=1n(yi−y¯¯¯)2(10) (10) S S T = ∑ i = 1 n ( y i − y ¯ ) 2
上式被称为观察值
y1,y2,⋯,yn y 1 , y 2 , ⋯ , y n 的离差平方和。
SST S S T 反映了观察值
yi(i=1,2,⋯,n) y i ( i = 1 , 2 , ⋯ , n ) 总的分散程度,对
SST S S T 进行分解,可得:
SST=∑i=1n(yi−y¯¯¯)2=∑i=1n[(y^i−y¯¯¯)+(yi−y^)]2=∑i=1n(y^i−y¯¯¯)2+∑i=1n(yi−y^)2+2∑i=1n(y^i−y¯¯¯)(y^i−y^)(11) (11) S S T = ∑ i = 1 n ( y i − y ¯ ) 2 = ∑ i = 1 n [ ( y ^ i − y ¯ ) + ( y i − y ^ ) ] 2 = ∑ i = 1 n ( y ^ i − y ¯ ) 2 + ∑ i = 1 n ( y i − y ^ ) 2 + 2 ∑ i = 1 n ( y ^ i − y ¯ ) ( y ^ i − y ^ )
可以证明
∑i=1n(y^i−y¯¯¯)(y^i−y^)=0 ∑ i = 1 n ( y ^ i − y ¯ ) ( y ^ i − y ^ ) = 0 ,所以则有:
SST=∑i=1n(y^i−y¯¯¯)2+∑i=1n(yi−y^)2=SSR+SSE(12) (12) S S T = ∑ i = 1 n ( y ^ i − y ¯ ) 2 + ∑ i = 1 n ( y i − y ^ ) 2 = S S R + S S E
其中:
SSRSSE=∑i=1n(y^i−y¯¯¯)2=∑i=1n(yi−y^)2(13) (13) S S R = ∑ i = 1 n ( y ^ i − y ¯ ) 2 S S E = ∑ i = 1 n ( y i − y ^ ) 2
SSR S S R 叫做回归平方和,反映了
yi(1,2,⋯,n) y i ( 1 , 2 , ⋯ , n ) 的分散程度,这种分散程度是由于
Y Y 和
X X 之间的线性关系引起的。
SSE S S E 叫做残差平方和,反映了 yi y i 与回归值 y^i y ^ i 的偏离程度,它是 X X 对 Y Y 的线性影响之外的其余因素产生的误差。
3.2 F F 检验法
H0 H 0 成立时,可以证明:
F=SSRSSE/(n−2)∼F(1,n−2) F = S S R S S E / ( n − 2 ) ∼ F ( 1 , n − 2 )
对于给定的显著性水平
α α ,拒绝域为
W={F>Fα(1,n−2)} W = { F > F α ( 1 , n − 2 ) } ,对于
F F 检验统计量的
p p 值,如果
p<α p < α ,则拒绝
H0 H 0 ,表明两个变量之间的线性关系显著,这种检验法成为
F F 检验法
3.3 判定系数法
回归平方和 SSR S S R 占总平方和 SST S S T 的比例称为判定系数,也称决定系数,记做 R2 R 2 ,其计算公式为
R2=SSRSST=∑i=1n(y^i−y¯¯¯)2∑i=1n(yi−y¯¯¯)2 R 2 = S S R S S T = ∑ i = 1 n ( y ^ i − y ¯ ) 2 ∑ i = 1 n ( y i − y ¯ ) 2
在一元线性回归中,判定系数
R2 R 2 可以用来检验回归直线对数据的拟合程度,
如果 Y Y 的变化和 X X 相关, SSE S S E =0,则 SST S S T = SSR S S R ,于是 R2 R 2 =1,拟合是完全的,
如果 Y Y 的变化与 X X 无关,此时,则 R2 R 2 =0。
可见 R2∈[0,1] R 2 ∈ [ 0 , 1 ] , R2 R 2 越接近于1,回归直线的拟合程度越好, R2 R 2 越接近于0,回归直线拟合的程度越差。
3.4 估计标准误差
估计标准误差是残差平方和 SSE S S E 的均方根,即残差的标准差,用 se s e 来表示,其计算公式为:
se=SSEn−p−1−−−−−−−−√=∑i=1n(yi−y^i)2n−p−1−−−−−−−−−−⎷ s e = S S E n − p − 1 = ∑ i = 1 n ( y i − y ^ i ) 2 n − p − 1
其中
p p 为自变量的个数。
se s e 反映了用回归方程预测因变量时产生的预测误差的大小,因此从另一方面反映了回归直线的拟合程度。
4,最小二乘法公式推导
下面进行进行 (2) ( 2 ) 式的推导。
首先,原函数为
Q(a,b)=∑i=1n(yi−a−bxi)2(4) (4) Q ( a , b ) = ∑ i = 1 n ( y i − a − b x i ) 2
对
(4) ( 4 ) 式分别对
a a 和
b b 求一阶偏导数,得到下面公式:
∂Q∂a=∑i=1n2(yi−a−bxi)(−1)(5) (5) ∂ Q ∂ a = ∑ i = 1 n 2 ( y i − a − b x i ) ( − 1 )
∂Q∂b=∑i=1n2(yi−a−bxi)(−xi)(6) (6) ∂ Q ∂ b = ∑ i = 1 n 2 ( y i − a − b x i ) ( − x i )
对 (5) ( 5 ) 式,由一阶偏导数为0,可转化为:
∂Q∂a=∑i=1n(yi−a−bxi)=0 ∂ Q ∂ a = ∑ i = 1 n ( y i − a − b x i ) = 0
即:
ny¯¯¯−na−nbx¯¯¯=0 n y ¯ − n a − n b x ¯ = 0
所以求得
a a 的表达式为:
a=y¯¯¯−bx¯¯¯(7) (7) a = y ¯ − b x ¯
对
(6) ( 6 ) 式,由偏导数为0,可化简为:
∑i=1n(yi−a−bxi)(xi)=∑i=1n(yixi−axi−bx2i)=0 ∑ i = 1 n ( y i − a − b x i ) ( x i ) = ∑ i = 1 n ( y i x i − a x i − b x i 2 ) = 0
继续化简则有:
∑i=1n(yixi−axi−bx2i)=∑i=1nxiyi−anx¯¯¯−∑i=1nx2i(8) (8) ∑ i = 1 n ( y i x i − a x i − b x i 2 ) = ∑ i = 1 n x i y i − a n x ¯ − ∑ i = 1 n x i 2
将
(7) ( 7 ) 式带入
(8) ( 8 ) 式,则有
∑i=1nxiyi−anx¯¯¯−∑i=1nx2i=∑i=1nxiyi−(y¯¯¯−bx¯¯¯)nx¯¯¯−∑i=1nx2i=∑i=1nxiyi−nx¯¯¯y¯¯¯+b(nx¯¯¯2−∑i=1nx2i)=0(14) (14) ∑ i = 1 n x i y i − a n x ¯ − ∑ i = 1 n x i 2 = ∑ i = 1 n x i y i − ( y ¯ − b x ¯ ) n x ¯ − ∑ i = 1 n x i 2 = ∑ i = 1 n x i y i − n x ¯ y ¯ + b ( n x ¯ 2 − ∑ i = 1 n x i 2 ) = 0
可得:
b=∑i=1nxiyi−bx¯¯¯y¯¯¯∑i=1nx2i−nx2i(9) (9) b = ∑ i = 1 n x i y i − b x ¯ y ¯ ∑ i = 1 n x i 2 − n x i 2
又有:
∑i=1n(xi−x¯¯¯)(yi−y¯¯¯)=∑i=1n(xiyi−x¯¯¯yi−xiy¯¯¯+x¯¯¯y¯¯¯)=∑i=1n(xiyi−x¯¯¯yi−xiy¯¯¯+x¯¯¯y¯¯¯)=∑i=1nxiyi−nx¯¯¯y¯¯¯−nx¯¯¯y¯¯¯+nx¯¯¯y¯¯¯=∑i=1nxiyi−nx¯¯¯y¯¯¯(10) (10) ∑ i = 1 n ( x i − x ¯ ) ( y i − y ¯ ) = ∑ i = 1 n ( x i y i − x ¯ y i − x i y ¯ + x ¯ y ¯ ) = ∑ i = 1 n ( x i y i − x ¯ y i − x i y ¯ + x ¯ y ¯ ) = ∑ i = 1 n x i y i − n x ¯ y ¯ − n x ¯ y ¯ + n x ¯ y ¯ = ∑ i = 1 n x i y i − n x ¯ y ¯
∑i=1n(xi−x¯¯¯)2=∑i=1n(x2i−2x¯¯¯xi−x¯¯¯2)=∑i=1nx2i−2nx¯¯¯2+x¯¯¯2=∑i=1nx2i−nx¯¯¯2(11) (11) ∑ i = 1 n ( x i − x ¯ ) 2 = ∑ i = 1 n ( x i 2 − 2 x ¯ x i − x ¯ 2 ) = ∑ i = 1 n x i 2 − 2 n x ¯ 2 + x ¯ 2 = ∑ i = 1 n x i 2 − n x ¯ 2
将公式 (10) ( 10 ) 和公式 (11) ( 11 ) 带入公式 (9) ( 9 ) ,即可得到公式 (2) ( 2 ) ,即:
b=∑i=1n(xi−x¯¯¯)(yi−y¯¯¯)2∑i=1n(xi−x¯¯¯)2=LxyLxx(15)(2) (2) (15) b = ∑ i = 1 n ( x i − x ¯ ) ( y i − y ¯ ) 2 ∑ i = 1 n ( x i − x ¯ ) 2 = L x y L x x
最终得到
a a 和
b b 的估计公式如下:
⎧⎩⎨⎪⎪⎪⎪⎪⎪b^=∑i=1n(xi−x¯¯¯)(yi−y¯¯¯)2∑i=1n(xi−x¯¯¯)2=LxyLxxa^=y¯¯¯−b^x¯¯¯(13) (13) { b ^ = ∑ i = 1 n ( x i − x ¯ ) ( y i − y ¯ ) 2 ∑ i = 1 n ( x i − x ¯ ) 2 = L x y L x x a ^ = y ¯ − b ^ x ¯