神经网络最大的优点,以及最严重的缺陷

640?wx_fmt=gif


大家好,我是为人造的智能操碎了心的智能禅师。

最近条子说他弄个了个新零售的神经网络。一般办公室里的半自动贩售便利柜,都是扫码以后,靠自觉取产品。条子是闭着眼睛,靠神经取产品…

我说你这不是神经网络,你这就是神经病。他还不服气,说禅师你看,现在神经网络多火啊!

神经网络最大的优点,以及最严重的缺陷_第1张图片

百度指数?

神经网络最大的优点,以及最严重的缺陷_第2张图片

Google Trends?

感觉好像神经网络简直就是万能神油一样,人们希望干什么都能用到神经网络。图像、自然语言、医疗…

人工智能头条的一些粉丝群里,也有人问起:到底这个神经网络,好在哪里?而他到底有没有什么缺陷的地方呢?

刚好 SAP 机器学习基金会的成员 Niklas Donges 就写了一篇文章,详细解读了神经网络(各种 NN)的优点和缺陷,并授权人工智能头条翻译发布

全文大约2500字。读完可能需要好几首下面这首歌的时间

?

640?wx_fmt=png

炒作,为什么?

Niklas Donges 觉得,最近的神经网络是火的有点过了。当然,这也是有原因的:

原因之一:数据

几十年来积累的海量数据,在2018年,迎来了最光辉的时刻!使得神经网络能够真正展示自己的潜力。数据之于神经网络,就好比波纹之于 JoJo,气之于龟仙人。

数据越多,神经网络越浪!

相比之下,传统的机器学习算法在数据量面前,会触及一个天花板。一旦到达极限,传统机器学习算法将无法跟上数据增长的步伐,性能则停滞不前。我们用一张图来更直观的说明:

神经网络最大的优点,以及最严重的缺陷_第3张图片


原因之二:计算能力

另一个非常重要的原因是现在的计算能力。想想比特币矿机,单机就能达到那样恐怖的算力!

强大的算力能够处理更多数据,节省更多时间。根据人工智能领域的重要人物 Ray Kurzweil 的说法,计算能力是呈指数增长。

是不是想起了摩尔定律?

原因之三:算法

增加深度学习流行度的第三个因素是算法本身已经取得的进步。这些最近在算法开发方面的突破,主要是因为它们比以前运行得更快,这就可以尽可能充分的的利用所有数据,做到不浪费。

原因之四:营销

营销,就是给太上老君八卦炉扇火的那把芭蕉扇,可以把星星之火,扇成森林大火。

自1944年提出神经网络概念以来,已经被炒过一轮了,市场已经疲软,没人相信和投资了。 

“深度学习”这个词,赋予了它一个新的名字,使新的炒作成为可能。这也是为什么,许多人错误地认为深度学习是一个新创造的领域。

此外,还有其他一些因素促成了深度学习的营销。例如第一个机器人公民 Sophia,以及机器学习等主要领域的几项突破等等。

神经网络最大的优点,以及最严重的缺陷_第4张图片

图片来源:http://www.tvisha.com/blog/sophia-the-first-robot-citizen-in-saudi-arabia/

Pros vs Cons

抛开这些虚幻的因素,接下来 Niklas Donges 通过和传统机器学习算法的对比,阐述了神经网络的优缺点。

优点

神经网络的主要优点,在于它们能够胜过几乎所有其他机器学习算法。例如在癌症检测中,对于性能的要求是非常高的,因为性能越好,可以治疗的人越多。

缺点1:著名的“黑匣子”问题

神经网络最大的优点,以及最严重的缺陷_第5张图片

图片来源: https : //www.learnopencv.com/neural-networks-a-30000-feet-view-for-beginners/ 

神经网络最着名的缺点,可能就是“黑匣子”性质。这意味着你不知道你的神经网络将会如何产出结果,更不知道为什么会产生这种结果。

例如,你把一张猫的图像放入神经网络,结果告诉你这是个汽车 ?。而且你也没办法找出问题的症结所在。

相反,像决策树这样的算法,是遵循一定的逻辑性,是可被解释的,你就很容易找出问题所在,并进行调整。在某些领域,这种可解释性非常重要!比如银行。

银行不会使用神经网络来预测一个人的信誉。银行需要向客户解释为什么没有获得贷款,而神经网络恰恰无法做出解释。

假如 Quora 决定使用神经网络算法删除垃圾帐户,结果就像是灭霸的手套一样,反正你也不知道它是根据什么规则定义一个账户是不是垃圾账户,结果就被灭了。

你觉得被删除账户的用户,会接受“我们也不清楚,这都是计算机决定的”这种解释吗?

以及,你能想象马云收购一家公司,只是因为“电脑”说他需要这样做?

缺点2:耗时耗力

神经网络最大的优点,以及最严重的缺陷_第6张图片

(图片来源: http : //slideplayer.com/slide/6816119/ )

虽然有像 Keras 这样的库,使得神经网络的开发变得相当简单。但有时你需要更多地控制算法的细节,

例如试图用机器学习来解决一个从没有人做过的难题。你可能会使用 Tensorflow,它是为你提供了更多的可能性。但它更复杂,开发需要更长的时间(取决于你想要构建的东西)。 

那么对于公司管理层来说问题就出现了,真的值得动用昂贵的工程师花费数周时间吗?可能用其他算法,一天就搞定了。

缺点3:数据饕餮

神经网络比传统的机器学习算法通常来说,需要更多的数据。数千,甚至数百万的标记样本才够。这么多的数据从哪儿来?显然是个非常让人头疼的问题。

相较而言,像朴素贝叶斯这样的简单算法,可以更好地处理小数据。

神经网络最大的优点,以及最严重的缺陷_第7张图片

(图片来源: https : //abm-website-assets.s3.amazonaws.com/wirelessweek.com/s3fs-public/styles/contentbodyimage/public/embedded_image/2017/03/gpu%20fig%202.png?itok= T8Q8YSe- )

缺点4:贵

这里的贵,指的是算力的昂贵,时间的昂贵。最先进的深度学习算法,实现真正深度神经网络的成功训练,可能需要数周才能完全训练完毕。

然而大多数传统的机器学习算法训练时间要少得多,从几分钟到几小时或几天不等。

神经网络所需的计算能力在很大程度上取决于数据的大小,也取决于网络的深度和复杂程度。只有一个层 + 50个神经元的神经网络,当然比1000个决策树的随机森林快得多。相比之下,有50个层的神经网络,将比仅具有10个决策树的随机森林慢得多。

总结

虽然 Niklas Donges 认为神经网络被过度预期了。但他同时认为,我们生活在机器学习复兴中。因为它越来越亲民,越来越多的人能够用来构建有用的产品。

但一些现实问题,我们也不能忽视。目前,只有少数人了解可以用神经网络做什么,并且知道如何建立成功的数据科学团队,为公司带来真正的价值。

虽然我们拥有如此多的天才级博士工程师,他们深谙机器学习背后理论,却缺乏对商业方面的理解。 

同时,企业的高管,CEO,并不了解深度学习。他们被忽悠的认为,公司面临的所有问题都会被人工智能在未来几年内解决掉 ?。 

所以,我们需要更多人来衔接两者的鸿沟,从而产生更多对我们社会有用的产品。

作者介绍

神经网络最大的优点,以及最严重的缺陷_第8张图片


Bonus

作者提到的《原则》一书,扫码下面二维码即可免费试读,以及购买电子版。

神经网络最大的优点,以及最严重的缺陷_第9张图片


640?wx_fmt=png

幸福
无非就是
我  AI  你


640?wx_fmt=gif

你可能感兴趣的:(神经网络最大的优点,以及最严重的缺陷)