第二天:简单线性回归
step1:数据初处理。(同第一天的内容:导入库,导入数据集、处理丢失数据、分隔数据集、特征缩放。) step2:用训练集匹配简单的线性模型(使用sklearn.linear_modle的LinearRegression类,然后在使用LinearRegression类的regressor对象,再用LinearRegression类中的fit()方法来训练regressor对象) step3:预测结果(通过测试集来预测结果,把结果保存在向量Y_pred) step4:可视化(使用matplotlib.pyplot库来制作散点图)
代码:
step2 使用线性模型来训练
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor = regressor.fit(X_train,Y_train)
step3 预测结果
Y_pred = regressor.predict(X_test)
step4 可视化
plt.scatter(X_train,Y_train,color = 'red')
plt.plot(X_train,regressor.predict(X_train),color='blue')
plt.scatter(X_test,Y_test,color='red')
plt.plot(X_test,regressor.predict(X_test),color='blue')
plt.show() #让图像显示出来