BIC/AIC/Adjusted R-Squared

AIC

基于SSE(sum of squared errors), 但是包含了一个惩罚项。

A I C ( k ) = l n ( S S E T ) + ( k + 1 ) 2 T AIC(k) = ln(\frac{SSE}{T}) + \frac{(k+1)2}{T} AIC(k)=ln(TSSE)+T(k+1)2

k 代表变量的个数,T是样本的大小。 当样本的大小增加时,惩罚项以 1 T \frac{1}{T} T1的的速率减小。

BIC

同样也是基于SSE, 但包含的惩罚项不同。

B I C ( k ) = l n ( S S E T ) + ( k + 1 ) l n ( T ) T BIC(k) = ln(\frac{SSE}{T}) + \frac{(k+1)ln(T)}{T} BIC(k)=ln(TSSE)+T(k+1)ln(T)

当样本的大小增加时,惩罚项以 l n ( T ) T \frac{ln(T)}{T} Tln(T)的的速率减小。

所以BIC的惩罚项会有更大的权重。

因为BIC对于惩罚项的权重更大,所以BIC倾向于选择更小的模型(具有更少的变量的模型)。

Adjusted R-squared

A d j u s t e d R − S q u a r e d = 1 − S S E S S T n − 1 n − k − 1 Adjusted R -Squared = 1 - \frac{SSE}{SST} \frac{n-1}{n-k-1} AdjustedRSquared=1SSTSSEnk1n1

当比较模型时,我们选择具有更小的AIC、BIC 和更大的adjusted R-Squared。

你可能感兴趣的:(BIC/AIC/Adjusted R-Squared)