机器学习总结三之线性回归

机器学习总结三之线性回归

线性回归定义

线性回归:利用线性回归方程的最小二乘函数对一个或者多个自变量和因变量之间关心进行建模的方法
线性回归数学定义:
数据
( Y i , X i 1 , . . . , X i p ) , i = 1 , . . . n (Y_{i},X_{i1},...,X_{ip}), i=1,...n (Yi,Xi1,...,Xip),i=1,...n
模型
Y = X β + ϵ Y=X\beta+\epsilon Y=Xβ+ϵ
解析解
β ^ = ( X T X ) − 1 X T Y \hat{\beta}=(X^{T}X)^{-1}X^{T}Y β^=(XTX)1XTY
上式中:
Y 为 包 括 了 观 测 值 的 列 向 量 Y 1 , . . . , Y n 。 Y为 包括了观测值的列向量 Y_{1}, ...,Y_{n} 。 YY1,...,Yn
β 为 包 括 了 参 数 值 的 列 向 量 。 \beta 为包括了参数值的列向量。 β
X = ( 1 x 11 . . . x 1 p 1 x 21 . . . x 2 p . . . . . . . . . 1 x n 1 . . . x n p ) X=\begin{pmatrix} 1 & x_{11}& .& .& .&x_{1p} \\ 1& x_{21}& .& . & . & x_{2p}\\ .& .& .& & & \\ .& .& & .& & \\ .& .& & & .& \\ 1& x_{n1}&. &. &. &x_{np} \end{pmatrix} X=11...1x11x21...xn1............x1px2pxnp
X T X 不 可 逆 的 时 候 可 以 采 取 的 对 策 : X^{T}X 不可逆的时候可以采取的对策: XTX

  • 使用伪逆代替其逆矩阵,Python:numpy.linalg.pinv()
  • 去掉冗余特征(线性相关的特征)
  • 减少特征使得特征p<=n

线性回归解析解推导

示例

详见机器学习总结一

你可能感兴趣的:(机器学习)