你可能不知道,机器学习的核心竟然是学会忘记

很多人并不知道,机器学习的核心竟然是教会机器学会忘记。

你没看错,就是“忘记”。

人之所以智能,是因为我们有一种能力,只记住需要记住的东西,有些不重要的特征,会自然选择遗忘。

我举个栗子

看下面两张图

你一眼就能看出来,这是同一个人,江疏影。

我们会自动忽略发型/眼神/耳环/衣物/角度等不重要的区别,换句话说,在我们的脑海中,我们只是比较了这两个图片的“重要特征”。

可是,让机器认为这是同一个人,并不是很容易的事儿。

“精确”,是计算机天生的属性,它们会精确的记住每一个信息细节,让机器来认定“相同”,除非在每一个信息上,每一个比特,全部都相等才可以。

要想使它们“忘记”一些不重要的特性,很难。

那是以前

现在有了神经网络,这个网络会自动忽略细节,捕捉重要特征,完全模拟人类的模式来进行图片识别。

补充两个概念吧。

对于一些细节,如果我们的算法关注过头了,叫做“过拟合”,这种情况下,需要让算法进行“忘记”,过拟合是机器的天然属性,算法的调优,在很多时候是消除过拟合。这个并不容易,有很多机器学习的例子都是给定已经清理好的数据,但是,数据的清理,消除噪声,才是消除过拟合的最重要的一步。

有过拟合,就有欠拟合,那就是细节关注不够喽。

下面三个图是同样的数据,分别代表欠拟合/正合适/过拟合

一个过拟合的算法会把“江疏影” 和 “略微变换的江疏影” (姿势/发型稍有变化)

认为不是同一个人,而一个欠拟合的算法会把“江疏影”和“马士兵”认定为同一个人

那么问题就来了,刚才我讲过了“过拟合”产生的原因,那么:

1:“欠拟合”会在什么情况下产生呢?

2:一个中国游客吐了口痰,我们就说“中国人素质差”,这是犯了过拟合的错误还是欠拟合的错误呢?

3:白羊座容易过拟合还是欠拟合?

4:处女座容易过拟合还是欠拟合?

留言吧。

需要神经网络视频资料,进群可以寻找哦


你可能感兴趣的:(你可能不知道,机器学习的核心竟然是学会忘记)