对于回归预测结果,通常会有平均绝对误差、平均绝对百分比误差、均方误差等多个指标进行评价。这里,我们先介绍最常用的3个
目录
平均绝对误差(MAE)
均方误差(MSE):均方根误差(RMSE)
平均绝对百分比误差 MAPE
MAE 的值越小,说明预测模型拥有更好的精确度。The MAE is used to measure the average absolute error between the predicted value and the real value on the experimental data set. For a test set containing n microblog messages, MAE is defined as:
import numpy as np
def mae_value(y_true, y_pred):
"""
参数:
y_true -- 测试集目标真实值
y_pred -- 测试集目标预测值
返回:
mae -- MAE 评价指标
"""
n = len(y_true)
mae = sum(np.abs(y_true - y_pred))/n
return mae
它表示误差的平方的期望值,它的计算公式如下 MASE is used to measure the deviation between the observed value and the true value. MASE is more sensitive to outliers. MASE is defined as follows:
import numpy as np
def mse_value(y_true, y_pred):
"""
参数:
y_true -- 测试集目标真实值
y_pred -- 测试集目标预测值
返回:
mse -- MSE 评价指标
"""
n = len(y_true)
mse = sum(np.square(y_true - y_pred))/n
return mse
MAPE 是 MAD 的变形,它是一个百分比值,因此比其他统计量更容易理解。例如,如果 MAPE 为 5,则表示预测结果较真实结果平均偏离 5 %。MAPE 的计算公式如下:MAPE is used to measure the relative errors between the average test value and the real value on the test set. MAPE is defined as:
MAPE 的值越小,说明预测模型拥有更好的精确度。使用 Python 实现 MSE 计算函数:
import numpy as np
def mape(y_true, y_pred):
"""
参数:
y_true -- 测试集目标真实值
y_pred -- 测试集目标预测值
返回:
mape -- MAPE 评价指标
"""
n = len(y_true)
mape = sum(np.abs((y_true - y_pred)/y_true))/n*100
return mape