第二章.线性回归以及非线性回归—标准方程法

第二章.线性回归以及非线性回归

2.8 标准方程法

1.公式

1).代价函数:

第二章.线性回归以及非线性回归—标准方程法_第1张图片

2).累加平方和用矩阵表示:

第二章.线性回归以及非线性回归—标准方程法_第2张图片

2.对( − )( − )求导的两种布局方式:

1).分子布局(Numerator-layout)

  • 分子为列向量或者分母为行向量

2).分母布局(Denominator-layout)

  • 分子为行向量或者分母为列向量

  • 公式推导
    第二章.线性回归以及非线性回归—标准方程法_第3张图片
    第二章.线性回归以及非线性回归—标准方程法_第4张图片
    第二章.线性回归以及非线性回归—标准方程法_第5张图片

  • 维基百科中的求导公式:
    第二章.线性回归以及非线性回归—标准方程法_第6张图片

3.矩阵不可逆的情况:

  • 线性相关的特征(多重公用性)

第二章.线性回归以及非线性回归—标准方程法_第7张图片

  • 特征数据太多(样本数m<=特征数n)

4.梯度下降法VS标准方程法:

/ 梯度下降法 标准方程法
优点 当特征值非常多的时候也可以很好的工作 1).不需要学习率; 2).不需要迭代; 3).可以得到全局最优解;
缺点 1).需要选择合适的学习率; 2).需要迭代很多个周期; 3).只能得到最优解的近似值; 1).需要计算(X T X)−1 ; 2).时间复杂度大约是O(n3),n是特征数量;

说明:sklearn中封装的线性回归模型是标准方程法,而不是梯度下降法

5.实战: 标准方程法

1).CSV中的数据:

  • data.xlsx
  • 上传文件为excel文件,需转换成csv文件使用

2).代码

import numpy as np
import matplotlib.pyplot as plt

# 加载数据
data = np.loadtxt('D:\\data\\data.csv', delimiter=',')
# 数据切片并增加一个维度
x_data = data[:, 0, np.newaxis]
y_data = data[:, 1, np.newaxis]

# 样本增加偏置项
X_data = np.concatenate((np.ones((100, 1)), x_data), axis=1)


# 标准方程法求解回归参数
def weights(xArr, yArr):
    xMat = np.mat(xArr)
    yMat = np.mat(yArr)
    # 矩阵乘法
    xTx = xMat.T * xMat
    # 判断该矩阵是否存在逆矩阵
    if np.linalg.det(xTx) == 0.0:
        print("This matrix cannot do inverse")
        return

    return xTx.I * xMat.T * yMat


ws = weights(X_data, y_data)
print('参数:', ws)

# 画图
x_test = np.array([[20], [80]])
y_test = x_test * ws[1] + ws[0]
plt.plot(x_data, y_data, 'b.')
plt.plot(x_test, y_test, 'r')
plt.show()

3).结果展示:

①.数据

在这里插入图片描述

②.图像

第二章.线性回归以及非线性回归—标准方程法_第8张图片

你可能感兴趣的:(回归,线性回归,python)