python金融分析小知识(33)——机器学习之多元线性回归算法的使用

Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助!

今天要给大家介绍一种多元线性回归的机器学习算法,适用于多种特征用于预测标签的情况,话不多说直接上案例。

1.读取数据

今天要使用到的这份数据有四个特征一个标签,我们希望通过机器学习多元线性回归来进行特征的预测。

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression #线性回归模型
import matplotlib.pyplot as plt

读取数据:

python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第1张图片

简单地进行一些数据探索:

python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第2张图片

python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第3张图片

2.分割特征与标签 

X = df.iloc[:,:-1] #feature
X.head()

y = df[['PE']] #target
y.head()

python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第4张图片

python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第5张图片

3. 拆分训练集和测试集

from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X, y, random_state=1)
X_train #训练集

python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第6张图片 python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第7张图片

4.线性回归模型建模 

line = LinearRegression()
line.fit(X_train,y_train)

 通过打印截距与系数我们已经可以得到线性回归的方程:python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第8张图片

 线性回归的表达式如下:7964c639eb104d89aa31f0758ed2240e.png

5.模型评价 

我们来查看预测值:

python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第9张图片

查看误差,代码以及结果如下:

from sklearn import metrics
print("MSE: ", metrics.mean_squared_error(y_test,y_pred))
print("RMSE: ", np.sqrt(metrics.mean_squared_error(y_test,y_pred)))
print('R^2: ', metrics.r2_score(y_test,y_pred))
MSE:  20.83719154722035
RMSE:  4.564777272465805
R^2:  0.9297935741511321

6.整理结果 

data = pd.concat([pd.DataFrame(y),pd.DataFrame(y_predicted)],axis=1)
data.columns = ['Measured','Predicted']
data

python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第10张图片 绘图:

import plotly_express as px
fig = px.scatter(data,x='Measured',y='Predicted',trendline='ols',trendline_color_override='red')
fig.show()

这张图横坐标是真实值,纵坐标是预测值:python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第11张图片我们还可以进一步查看图片的内容:

python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第12张图片

这张图中甚至写出来拟合线的方程,以及R^2的大小: 

python金融分析小知识(33)——机器学习之多元线性回归算法的使用_第13张图片 

总的来说,通过多元线性回归模型得到的预测值和实际值可以很好的拟合上!

好啦今天就分享到这里! 

 

你可能感兴趣的:(金融,线性回归,算法)