正则化在最大似然参数估计中的解释

阅读【神经网络与机器学习】第二章的最大似然参数估计的感想。

书中具体内容请查看原文,大体内容就是讲最大似然参数估计算法,但其中有涉及到正则化。

其中的正则化项即是待估计参数W的先验概率,书中说W的先验概率是高斯分布,并且期望值为0。我一直在想为什么期望值是0。我觉得这涉及到对社会或者宇宙的理解。

比如我说人的身高和体重有某种w的关系,但是脱离了人,w没有任何意义,也即是说在宇宙中身高和体重就是没有任何关系的,只是在某一种限定下,两者才有参数w的关系,所以w的先验概率是高斯分布,期望值为0。

而w的方差又是什么?

文中说其方差若认为很大,则是表示完全相信数据。方差大的话正则化的权重就很小,这个不知道怎么解释,请大神指教。

你可能感兴趣的:(正则化在最大似然参数估计中的解释)