机器学习:回归模型的评价指标

1. 概述

对于回归而言,模型性能的好坏主要体现在拟合的曲线与真实曲线的误差。主要的评价指标包括:拟合优度/R-Squared,校正决定系数(Adjusted R-square),均方误差(MSE),均方根误差(RMSE),误差平方和(SSE),平均绝对误差(MAE),平均绝对百分比误差(MAPE)。

1. 均方误差

(Mean Squared Error,MSE):观测值与真值偏差的平方和与观测次数的比值:
在这里插入图片描述

要点:
  • MSE相当于模型中的损失函数,线性回归过程中尽量让该损失函数最小。
  • 模型之间的对比也可以用它来比较。
  • MSE可以评价模型的预测精度,MSE的值越小,说明预测模型对于目标的拟合程度越精确。

2. 均方根误差(标准误差)

(Root Mean Squard Error,RMSE):均方误差的算术平方根。
在这里插入图片描述

要点:
  • 均方根误差是用来衡量观测值同真值之间的偏差。
  • 它的意义在于开个根号后,误差的结果就与数据是一个级别的,可以更好地来描述数据。
  • 标准误差对一组测量中的特大或特小误差反映非常敏感(易受异常值的影响),
  • 所以,标准误差能够很好地反映出测量的精密度。这正是标准误差在工程测量中广泛被采用的原因。

3. 平均绝对误差

(Mean Absolute Error,MAE):平均绝对误差是绝对误差的平均值
在这里插入图片描述

4、平均绝对百分比误差(MAPE)

平均绝对百分比误差(Mean Absolute Percentage Error),与RMSE相比,更加鲁棒,因为MAPE对每个点的误差进行了归一化。
在这里插入图片描述

5. 拟合优度/R-squared

在这里插入图片描述

  • 分子就是我们训练出的模型预测的误差和。
  • 分母就是瞎猜的误差和。(通常取观测值的平均值)

如果结果是0,就说明我们的模型跟瞎猜差不多。
如果结果是1。就说明我们模型无错误。

  • R 2 介于0~1之间,越接近1,回归拟合效果越好,一般认为超过0.8的模型拟合优度比较高

化简上面的公式
分子分母同时除以m,那么分子就变成了我们的均方误差MSE,下面分母就变成了方差。
在这里插入图片描述

6. 校正决定系数(Adjusted R-square)

在这里插入图片描述
其中,n为样本数量,p为特征数量。

取值范围还是负无穷到1,大多是 0~1,且越大越好

你可能感兴趣的:(机器学习,机器学习)