正则化-最通俗的解释

正则化-最通俗的解释

  • 一.正则化-大白话解释

一.正则化-大白话解释

正则化”是机器学习中的一个术语,那么在解释正则化之前,不得不解释与之非常非常关系密切的另一个机器学习的术语“过拟合”…

“过拟合”是指机器学习在训练模型时,模型与训练数据贴合的太好了,好到误差基本接近于0了(就好比海尔兄弟似的,天天穿着裤衩子在一起,密不可分,不好意思跑题了…)如下最右边的图所示:

过拟合
“过拟合”会导致模型的“泛化“”能力太差,那什么是“泛化“”能力呢?说的再通俗点,就是模型的通用能力,训练的模型如果只能适用于某种特定的即为苛刻条件,那么这个模型可用的范围,所能承受的抗干扰性(术语叫做鲁棒性)就太差了…

所以为了 防止模型出现“过拟合”的现象,于是就提出了“正则化”这一概念…

正则化正是为了防止训练模型时,产生过拟合的现象;

举个非常感性的例子,如果我们搬了一块非常平整大理石瓷砖,我们暂时想把这片瓷砖放在另一片瓷砖上,但是如果直接放在上边,那么这两片瓷砖就会贴合的非常好,如果想再次拿起来上边这一片瓷砖就非常的不容易,所以我们在瓷砖与瓷砖的边缘之间放上一根树枝之类的物体,为的就是让瓷砖与瓷砖之间有间隔、有缝隙,这样我们就可以把手指扣进去更加使得上劲的把上边的瓷砖搬走了…
正则化-最通俗的解释_第1张图片
再举一个理性的例子,点线(蓝色的···线)表示的是,在以圆圈表示的国家上训练的原始模型(没有正方形表示的国家),虚线(红色的—线)是我们在所有国家(圆圈和方形)上训练的第二个模型,实线是用与第一个模型相同的数据训练的模型,但是有一个正则化约束。
可以看到,正则化强制了模型的斜率较小:该模型与训练数据(圆圈)的拟合不如第一个模型,但它实际上更好地泛化了它没有在训练时看到的新实例(方形)。
正则化-最通俗的解释_第2张图片

今天的分享就到这里,希望可以帮助到大家…

你可能感兴趣的:(机器学习,机器学习)