纳什效率系数与可决系数的差异

纳什效率系数与可决系数的差异

  • 正文
  • 参考文献


正文

纳什效率系数和可决系数的公式形式非常相似,主要差异如下:
  1. 可决系数(Coefficient of determination,R)是用来度量一个统计模型的拟合优度的。
    R 2 = 1 − ∑ ( y i − y ^ i ) 2 ∑ ( y i − y ‾ ) 2 R^2 =1-\frac{\sum{(y_i-\hat{y}_i)^2}}{\sum{(y_i-\overline{y})^2}} R2=1(yiy)2(yiy^i)2
    式中: y i y_i yi是变量观测值; y ‾ \overline{y} y是变量观测值的均值; y ^ i \hat{y}_i y^i是统计模型的变量模拟值;举个例子,如果我们有一系列观测值 x i x_i xi y i y_i yi,我们假设用一元线性回归模型 y = a x + b y=ax+b y=ax+b模拟变量之间的关系,可以得到一系列模拟值 y ^ i = a ^ x i + b ^ \hat{y}_i=\hat{a}x_i+\hat{b} y^i=a^xi+b^。如果 x x x y y y没有相关关系,最小二乘估计的参数为 a ^ = 0 , b ^ = y ‾ \hat{a}=0,\hat{b}=\overline{y} a^=0,b^=y,此时 R 2 = 0 R^2=0 R2=0,因此, R 2 R^2 R2的最小值为0,即残差平方和 ( y i − y ^ i ) 2 {(y_i-\hat{y}_i)^2} (yiy^i)2不会小于总的平方和 ( y i − y ‾ ) 2 {(y_i-\overline{y})^2} (yiy)2 R 2 R^2 R2的取值范围为[0,1]。
  2. 纳什效率系数(Nash-Sutcliffe Efficiency, NSE)常用于用于量化模拟模型(如水文模型)的预测精度。
    N S E = 1 − ∑ ( y i − y i p r e d ) 2 ∑ ( y i − y ‾ ) 2 NSE =1-\frac{\sum{(y_i-{y_i^{pred}})^2}}{\sum{(y_i-\overline{y})^2}} NSE=1(yiy)2(yiyipred)2
    式中: y i p r e d y_i^{pred} yipred是预测模型对变量的预测值。预测值属于回归样本外得到的预测结果,和回归模型的模拟值有很大区别,模型误差的平方和 ( y i − y i p r e d ) 2 (y_i-{y_i^{pred}})^2 (yiyipred)2可能大于总平方和 ( y i − y ‾ ) 2 (y_i-\overline{y})^2 (yiy)2,对于一个完美的模型,估计的误差的方差等于0,则NSE=1;相反,一个模型产生的估计误差方差等于观察到的时间序列的方差,结果NSE=0。实际上,NSE=0表示该模型具有与时间序列平均值相同的预测能力,即误差平方和。当预测模型得到的估计误差方差显著大于观测值方差时,NSE<0。NSE值越接近1,表明模型预测能力越好。因此NSE的取值范围为 ( − ∞ , 1 ] (-\infty, 1] (,1]。但是如果将NSE用于模型回归中,则和 R 2 R^2 R2完全等价,范围是[0,1]。

参考文献

[1] https://en.wikipedia.org/wiki/Nash%E2%80%93Sutcliffe_model_efficiency_coefficient
[2] https://en.wikipedia.org/wiki/Coefficient_of_determination
[3] https://stats.stackexchange.com/questions/185898/difference-between-nash-sutcliffe-efficiency-and-coefficient-of-determination/230002#230002?newreg=2a378583117b4380bb38a8884c23fdd4

你可能感兴趣的:(时间序列,预测,回归,评估指标,纳什效率系数,可决系数)