(可不看)
最近在做非线性数据的数据预测,一头雾水,一年不学习,脑袋有问题。还记得上次做的数据是关于一个政务系统的热点问题分类模块,用了机器学习和深度学习啥的,满脸蒙,反正后面就是做完了(好多吐槽)。
现在做的是关于供应链模块的需求预测,简单说目前的运作流程是:客户需求–>营业人员经验修正–>客户需求生成。
面临问题:客户的需求不能保证准确性,营业人员出于保证出货而减少风险的考虑,修正的客户需求跟未来实际需求不一致,甚至多出十几倍。
修正办法:
1.参考单因素的房价预测
训练数据:历史客户需求和实际出货
2.参考时间序列分析的股价预测
训练数据:历史实际出货
这两部分的具体操作在这就不详细说明了,以后再更新(咕咕)
今天,我们学习线性回归算法的评价指标——MAE(平均绝对误差)、MSE(均方误差)、RMSE(均方根误差)、R Square、MAPE(平均绝对百分比误差)。数据公式编者这里就不再提供了,简单介绍下每个的大概意思和Python用法估计就够了:(懒癌晚期)
from sklearn.metrics import mean_absolute_error
mean_absolute_error(y_test,y_pred)
MAPE = np.mean(np.abs((y_test - y_pred)/y_test))`
from sklearn.metrics import mean_squared_error
mean_squared_error(y_test,y_pred)
from sklearn.metrics import mean_squared_error
from math import sqrt
sqrt(mean_squared_error(y_test,y_pred))
from sklearn.metrics import r2_score
r2_score(y_test,y_pred)
建议多指标同时用来观测,之前出现过R方为负数,但是其他评价指标均良好的情况,简直为难我刘牛牛,求路过大佬解答本~