数据准备:dataM
数据字段:y,x1,x2,x3
python中统计学的回归模型:
import statsmodels.formula.api as smf
formula='y~x1+x2+x3'
resultM=smf.ols(formula,data=dataM).fit()
resultM.summary(title='线性回归')
输出回归模型的训练结果,在最后一部分有Jarque-Bera的统计量和显著性指标。
Jarque-Bera (JB):JB统计量
Prob(JB):JB的p值(显著性指标)
Jarque-Bera 是用来检验该线性回归模型的残差是否符合正态分布,原理是统计学中的假设检验。此处不做统计学原理解释(因为我也说不明白,等我弄明白了再分享)。
原假设H0:模型残差e服从正态分布
Prob(JB)<0.05:显著=>拒绝原假设H0=>模型残差e不服从正态分布
Prob(JB)>0.05:不显著=>不能拒绝原假设H0=>模型残差e服从正态分布
根据线性回归模型的要求,残差必须服从正态分布,所以Prob(JB)>0.5是我们想要的结果,越大越好。