sklearn实现多项式回归

sklearn实现多项式回归

sklearn实现多项式回归_第1张图片
类似这样的数据,显然利用多项式的曲线拟合会比直线效果要好很多
载入数据

data = np.genfromtxt("\job.csv",   delimiter=",")
x_data = data[1:, 1]
y_data = data[1:, 2]
x_data = data[1:, 1, np.newaxis]
y_data = data[1:, 2, np.newaxis]

定义多项式回归

poly_reg = PolynomialFeatures(degree=1)  # degree的值来调节多项式的特征,太小欠拟合,太大,多项式项数过多,过拟合
# 特征处理
x_poly = poly_reg.fit_transform(x_data)

特征处理前的x_data
sklearn实现多项式回归_第2张图片
特征处理后的x_poly
sklearn实现多项式回归_第3张图片
前边多出的“1”相当于给它加上了偏置,这是degree=1的情况。
定义回归模型

lin_reg = LinearRegression()

训练模型

lin_reg.fit(x_poly, y_data)

最后画图观察拟合效果

plt.plot(x_data, y_data, 'b.')
plt.plot(x_data, lin_reg.predict(poly_reg.fit_transform(x_data)), c='r')
plt.title('Truth or Bluff (Polynomial Regression)')
plt.xlabel('Position level')
plt.ylabel('Salary')
plt.show()

degree=10时的效果
sklearn实现多项式回归_第4张图片

你可能感兴趣的:(python,机器学习)