统计学学习——004多元线性回归和卡方分布

线性回归就是假设特征满足线性关系,根据已经获得一些数据来训练一个模型,并用这个模型进行预测。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析
模型给出了我们要学习的函数形式。
h w ( x i ) = w 0 + w 1 x 1 + w 2 x 2 + . . . + w n x n = W T X h_w(x^i) = w_0 + w_1x_1 + w_2x_2 + ... + w_nx_n = W^TX hw(xi)=w0+w1x1+w2x2+...+wnxn=WTX

(1)均方误差MSE
在这里插入图片描述
(2)平均绝对误差MAE
在这里插入图片描述
损失函数为
J ( W ) = 1 2 M ∑ i = 1 M ( h w ( x i ) − y i ) 2 = 1 2 M ( X W − Y ) T ( X W − Y ) J(W) = \frac{1}{2M}\sum_{i=1}^{M}(h_w(x^i) - y^i)^2 = \frac{1}{2M}(XW - Y)^T(XW - Y) J(W)=2M1i=1M(hw(xi)yi)2=2M1(XWY)T(XWY)

若n个相互独立的随机变量ξ₁,ξ₂,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
卡方分布的 期望E(χ2)=n,方差D(χ2)=2n。
卡方分布的概率密度函数为:
在这里插入图片描述

统计学学习——004多元线性回归和卡方分布_第1张图片
从分布图可以看出:分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数 n 的增大,分布趋近于正态分布;随着自由度n的增大,分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。

你可能感兴趣的:(统计学)