均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R²)解释

  各拟合方式解释:

1、均方误差:

均方误差(Mean Squared Error,MSE)是一种常用的衡量模型预测值与实际观测值之间差异的指标,用于评估模型在给定数据上的拟合程度。MSE 是通过计算预测值与实际观测值之间差异的平方的平均值得到。

MSE 的计算步骤如下:

1、对于每个观测值,计算模型的预测值。

2、对于每个观测值,计算预测值与实际观测值之间的差异,并将其平方。

3、对所有差异值进行求和,并除以观测值的总数,得到平均差异值,即 MSE。

MSE 的数值与原始观测值的单位的平方相同。它表示模型预测值与实际观测值之间的差异的平均大小,较小的 MSE 表示模型的预测值与实际观测值之间的差异较小,即模型的拟合程度较好。

MSE 的优点是对差异值进行平方操作,因此较大误差值对拟合度的影响会更大,这有助于更加敏感地捕捉模型的预测误差。

需要注意的是,MSE 受异常值的影响较大,因为异常值的平方差异会被放大。在使用 MSE 进行模型评估时,需要注意异常值的处理和模型的鲁棒性。

总而言之,MSE 是一种常用的拟合度指标,用于评估模型预测值与实际观测值之间的差异。较小的 MSE 值表示模型的拟合程度较好。

2、均方根误差:

均方根误差(Root Mean Squared Error,RMSE)是一种常用的衡量模型预测值与实际观测值之间差异的指标,它用于评估模型在给定数据上的拟合程度。RMSE 是通过计算预测值与实际观测值之间差异的平方的均值,并取其平方根得到。

RMSE 的计算步骤如下:

1、对于每个观测值,计算模型的预测值。

2、对于每个观测值,计算预测值与实际观测值之间的差异,并将其平方。

3、对所有差异值进行求和,并除以观测值的总数,得到平均差异值。

4、取平均差异值的平方根,即为 RMSE。

RMSE 的数值与原始观测值的单位相同。它可以衡量模型的预测误差的平均大小,较小的 RMSE 表示模型的预测值与实际观测值之间的差异较小,即模型的拟合程度较好。

RMSE 的优点是对较大误差值有较大的惩罚,因为它对差异值进行了平方操作。这可以避免较大误差值对拟合度的影响过大。

需要注意的是,RMSE 受异常值的影响较大,因为异常值的平方差异会被放大。在使用 RMSE 进行模型评估时,需要注意异常值的处理和模型的鲁棒性。

总而言之,RMSE 是一种常用的拟合度指标,用于评估模型预测值与实际观测值之间的差异。较小的 RMSE 值表示模型的拟合程度较好。

3、平均绝对误差

平均绝对误差(Mean Absolute Error,MAE)是一种常用的衡量模型预测值与实际观测值之间差异的指标,用于评估模型在给定数据上的拟合程度。MAE 是通过计算预测值与实际观测值之间差异的绝对值的平均值得到。

MAE 的计算步骤如下:

1、对于每个观测值,计算模型的预测值。

2、对于每个观测值,计算预测值与实际观测值之间的差异的绝对值。

3、对所有差异值进行求和,并除以观测值的总数,得到平均差异值,即 MAE。

MAE 的数值与原始观测值的单位相同。它表示模型预测值与实际观测值之间差异的平均大小,较小的 MAE 表示模型的预测值与实际观测值之间的差异较小,即模型的拟合程度较好。

MAE 的优点是它对异常值的影响较小,因为它使用了差异的绝对值,不受正负方向的影响。

需要注意的是,MAE 并未考虑差异的平方,因此它没有对差异值的平方差异进行放大,相对于均方误差(MSE)来说,MAE 反映了预测误差的绝对大小,而不是误差的平方大小。

总而言之,MAE 是一种常用的拟合度指标,用于评估模型预测值与实际观测值之间的差异。较小的 MAE 值表示模型的拟合程度较好。

4、决定系数(R2)

决定系数(Coefficient of Determination),通常表示为 R²,是一种用于评估回归模型拟合优度的统计指标。它表示因变量的变异性能够由模型解释的比例,即模型对数据的拟合程度。

R² 的取值范围在 0 到 1 之间。一个较高的 R² 值表示模型能够较好地解释因变量的变异性,即模型的拟合程度较好。

R² 的解释如下:

R² = 0:模型无法解释因变量的变异性,即模型的预测值与实际观测值没有关联。

R² = 1:模型完全能够解释因变量的变异性,即模型的预测值与实际观测值完全一致。

R² 的计算方式基于总平方和(Total Sum of Squares,TSS)、回归平方和(Regression Sum of Squares,RSS)和残差平方和(Residual Sum of Squares,ESS)。具体计算步骤如下:

1、计算总平方和(TSS),表示因变量的总变异性。

2、计算回归平方和(RSS),表示模型解释的变异性。

3、计算残差平方和(ESS),表示模型无法解释的剩余变异性。

4、计算 R²,公式为 R² = 1 - (ESS / TSS) = RSS / TSS。

R² 表示模型能够解释的因变量的变异性占总变异性的比例。较高的 R² 值表示模型能够较好地拟合数据,并且其预测值能够较好地解释因变量的变异性。

需要注意的是,R² 的解释存在一些限制。R² 只能衡量模型对因变量的拟合优度,但不能判断模型是否具有因果关系、是否过拟合或是否适合应用于其他数据集。在解释和使用 R² 时,还需要结合其他指标和领域知识来进行综合评估。

总结起来,R² 是一种用于评估回归模型拟合优度的指标,它表示模型能够解释的因变量的变异性的比例。较高的 R² 值表示模型的拟合程度较好。

总平方和(Total Sum of Squares,TSS)、回归平方和(Regression Sum of Squares,RSS)和残差平方和(Residual Sum of Squares,ESS)解释

1、总平方和(Total Sum of Squares,TSS):TSS 衡量因变量的总变异性。它是实际观测值与因变量均值之间差异的平方的总和。TSS 表示了在没有考虑任何自变量的情况下,因变量的总变异性。

2、回归平方和(Regression Sum of Squares,RSS):RSS 衡量模型解释的变异性。它是实际观测值与模型的预测值之间差异的平方的总和。RSS 表示了模型能够解释的因变量的变异性,即模型对数据的拟合程度。

3、残差平方和(Residual Sum of Squares,ESS):ESS 衡量模型无法解释的剩余变异性。它是实际观测值与模型的预测值之间的残差(观测值减去预测值)的平方的总和。ESS 表示了模型无法解释的因变量的剩余变异性,即模型无法完全拟合的部分。

你可能感兴趣的:(Python数据分析学习笔记,人工智能,python,机器学习)