《Python数据分析与应用》第7章 机器学习模型的应用 实训部分

《Python数据分析与应用》第7章 机器学习模型的应用 实训部分(源于大学课程python数据分析)

【目的及要求】

以股票价格预测为主题,利用所学的机器学习方法建立模型对股价进行预测,股票价格既可以是个股价格,也可以是股票指数。
1、到知网查阅文献资料,确定影响因素,即自变量;
2、定义因变量和自变量;
3、收集变量数据;
4、建立多种回归预测模型;
5、对模型结果进行比评价和比较

1.有下图文献所得八个自变量(人民币兑美元汇率、国民生产总值、货币(M1)供应量(亿元)、一年期存款利率(%)、基本每股收益(元)、净资产收益率(%)、速动比率(%) 、企业资产净值(万元)、总市值),因变量为收盘价)
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第1张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第2张图片
2.利用灰色预测和SVR模型,支持向量机模型、线性回归模型、梯度回归模型对股票相关因子进行建模
(1)灰色预测和SVR模型
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第3张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第4张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第5张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第6张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第7张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第8张图片
由上图所得需要利用Lasso回归方法识别影响股票收盘价格的关键影响因素是国民生产总值、货币(M1)供应量(亿元)、一年期存款利率(%)、基本每股收益(元)、净资产收益率(%)、企业资产净值(万元)、总市值),因变量为收盘价,剔除两个自变量(人民币兑美元汇率、速动比率)
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第9张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第10张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第11张图片
由于上图可知,方差比率来检验随机游走,方差比越大,说明可预测性越好;多数自变量的小残差概率接近1,说明除了净资产收益率,其它变量的异常点较少。
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第12张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第13张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第14张图片
由上述评价指标可知,利用可解释方差值和R方值等相对指标评判效果更好
(2)支持向量机模型
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第15张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第16张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第17张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第18张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第19张图片
由上述指标可知,支持向量机所建立模型的准确率很低。
(3)线性回归模型
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第20张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第21张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第22张图片
由于上述指标可知,线性回归的可解释方差值为0.70,R方(决定系数)为0.69
(5)梯度回归模型
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第23张图片
《Python数据分析与应用》第7章 机器学习模型的应用 实训部分_第24张图片
由上述评价指标可知,梯度回归模型的可解释方差值和为R方值均为0.98

3.因为平均绝对误差、均方误差、中值绝对误差为绝对数,评判较为困难,因此主要运用可解释方差值和R方值。可解释方差值为越大表示预测和样本值的分散分布程度越相近,R方值(决定系数)计算出来越是接近1,预测值越接近真实样本值。因此,综上所述,梯度回归的可解释方差更大,R方值更大,说明梯度回归模型更适合对股票收盘价的预测。

你可能感兴趣的:(python,数据分析,机器学习)