内容来源:本文为《暗知识:机器认知如何颠覆商业和社会》读书笔记;作者简介:王维嘉,中国科技大学学士和硕士,美国斯坦福大学博士。
为什么人工智能的学习速度特别快?
人工智能将会颠覆哪些行业?
《未来简史》一书的作者尤瓦尔·赫拉利(YuvalHarari)曾预测,若干年后,人类社会最大的问题是人工智能带来一大批“无用的人类”。
同时,也会催生出“超人类”(Superhuman)。他认为,一小部分超人类将可以借助科学技术不断地“更新”自身,操控基因,甚至实现人脑与计算机互联,获得一种不死的状态。
“在以前的历史上,贫富差距只是体现在财富和权力上,而不是生物学上,帝王和农民的身体构造是一样的。在人可以变成超人类后,传统的人性就不存在了,人类会分化为在体能和智能上都占据绝对优势的超人阶层和成千上万普通的无用的人类。”
他的担心会成为现实吗?
早在1965年,人工智能这个术语就被正式提出。
1977年,iBM深蓝战胜人类国际象棋冠军,标记着人工智能往前迈开了重要一大步。
2017年Alphago大胜柯洁,人工智能即将碾轧人类的话题遍进入大众视野,迅即引起普遍的狂热和焦虑。
人工智能做为新一轮科技革命和产业变革的重要驱动力量,无论是在自动驾驶还是医疗方面,都或多或少进行参与协助。
兼具研究者和投资者身份的的王维嘉博士在新著《暗知识:机器认知如何颠覆商业和社会》中告诉我们:机器中的深度学习,即将被颠覆的行业有哪些,以及我们应该如何应对未来。
人工智能这件事让大家觉得这件事情特别神奇,美国谷歌公司的围棋对弈程序Alphago战胜围棋天才,这件事是人工智能进入我们大众视野的一个里程碑事件。
围棋这样令人类引以为豪的东西,机器一下子远远高于人类,而且我们不懂,不知道为什么。
谷歌一年后继AlphaGo之后又造了一个叫AlphaGo 0,AlphaGo 0不学人类的经验,第一个AlphaGo 是先学人类的残局、学棋谱,最后超越人类。
AlphaGo 0就说我能不能自己和自己对弈,弄两个双胞胎兄弟自己打,从零学起。结果七天之后,AlphaGo 0就超过了AlphaGo的水平,40天之后,就打遍天下无敌手,到今天都没有人能打败它。
这件事给大家带来了很大的震撼,人类引以为傲的积累了两千年的围棋经验,对AlphaGo0来说,一钱不值。不仅一钱不值,而且是累赘,是束缚。
学了人类的棋谱以后反而受它的限制,水平不提高了。为什么会这样,这就需要我们要把这个问题想清楚,就逼着我们想到底学习的本质、知识的本质是什么。
大家知道过去的亚里士多德,一直到后来的理性主义一直在争人的知识从哪来的,是经验得来的还是推理得来的。大家争了两千年没有明确结果,为什么?
因为那个时代人们根本不了解大脑怎么工作的,甚至亚里士多德时代认为心是思维的器官,一直到70多年前,人们才大致搞清楚,学习的本质是大脑神经原的连接。
举个例子,比如说我们教一个孩子认字母O,这个孩子看到了一个椭圆形,耳朵听到了一个“欧”的发音。这时候这两个神经原,听觉的神经原和视觉神经原就连起来了,下次他听到声音就画出圆圈,看到圆圈发出O的声音。
说明他在这两件事情上建立了联系,所以说学习的本质就是这么简单。
一旦知道了这个道理之后,人们很自然的想到,我可不可以用电子线路模仿神经原的工作。
大家看这张照片是我和我的斯坦福导师,他是神经网络的鼻祖之一,我手里抱着一个黑盒子,就是一个神经原,是他1960年做出来的世界上第一个能够自我学习的神经原。这一个神经原能干什么呢?它能识别一个简单的图形,比如你告诉它字母A,它学习了以后,就能认识这是不是A。
今天,我们一颗芯片上可以放大概一亿个这样的黑盒子,因为从1960年到现在,计算机芯片的技术是上千万倍的增长。所以说当神经原多了以后,它就可以识别更复杂的图形,比如人脸识别。
大家看到机器学习、深度学习、神经网络,其实说的都是一回事。当然人工智能还有很多流派,今天发挥威力的这个人工智能,就是神经网络。
当我们理解的这些东西以后,我们就发现了另外一条线索,人类历史上是怎么理解知识的?
过去,大家以为我的知识就是所有的文字语言能表达出来的东西。就像在各大图书馆,你能翻阅到人类历史上积累的所有知识。
一直到70年前,有一个奥匈科学家麦克波兰尼发现了另外一种知识,叫默会知识,我们也叫默知识,就是只可意会,不可言传的意思。
比如说大家可能都会骑自行车,有没有一个人是看着手册学会的?每个人都父母把你放在车子上,你歪歪扭扭摔个跤就学会了,你也是这样教你的孩子、教你的朋友。
人类的很多其他技能,比如拉小提琴、跳芭蕾、打乒乓球等等,全是这类的,只可意会、不可言传的。
为什么说不出来?因为这样一个知识在我们的大脑里头建立了一个非常复杂的神经元的联系,但是我们语言的表达能力又非常弱。
比如我在这儿跟大家讲,每秒钟平均说五个字,所以语言能表达出来的信息要远远少于我们大脑里面存储的信息。
由于这个原因,大量的知识是以默知识的形式存在的。所以这个发现是人类历史上的一个重要的里程碑。
研究到这里,作者就在想,在我们的认知内有既可以表达,又可以感受的知识,也有不可以感受无法表达的知识。
大家看第一个象限,既可以感受又可以表达,比如说阿基米德就是在浴缸里发现了浮力定律,他感受到了浮力定律,又把它写出来了,这就是既可感受又可表达。
还有广义相对论、量子力学,我们人类感受不到引力波,但它是实实在在存在的,从数学上可以推导出来,可以验证的。所以这是不可感受的可以表达。
所以说在我们象限的右边就是我们大家熟悉的明知识,默知识就是第二象限,只可感受不可表达。
当我把这个图画出来的时候,很显然这个左下角是空白,这个时刻就是我发现暗知识的时刻,也是我明白了的时刻。
很显然,应该有一类知识是人类既不可感受又不可表达的,那这就是暗知识,这就是AlphaGo下围棋的知识。
为什么有些东西人类感受不到?因为我们的感观非常有限,比如我们的眼睛看不到红外线、我们的耳朵听不到超声波。
比如说我们听到马路上的噪音时,我们在脑子里留不下任何痕迹,因为我们听不明白里头是什么东西。所以它是不可感受的。
因为它比较复杂,所以我们又没法表达,所以既不可感受又不可表达,就是暗知识。
所以暗知识的本质就是机器发现了人类发现不了的、隐藏在万事万物中的复杂关系。因为我们的小脑袋瓜只能处理比较简单的关系,所以这就是暗知识。
知道了这个以后,暗知识、明知识和默知识这三者什么关系呢?我们可以看这张冰山的图。一个冰山,它的冰山一角,水面上的东西就是我们人类上万年来已知的所有的明知识,可以用语言文字公式表达的。
水面下面的冰山就是默知识,整个海洋就是暗知识,它们之间的关系就是这样。
所以为什么机器能如此迅速的学习呢?因为他们能掌握了一个核心技能:群体学习。
什么叫群体学习?谷歌做了这么一个实验,它做了一个机械手,机械手下面放了一个盘子,这个盘子里头放了一些杂物,手电筒、钢笔乱七八糟的东西,不同的形状。它现在让机器自己学,从盘子里把东西抓到外面来。
一开始机器乱抓,抓不着,偶然的机器就抓到了一个东西,这时候机器知道,我要在这个高度抓东西。然后不同的形状它又慢慢摸索,十几天以后,它就可以稳定地把盘子里面的物体都抓出来。
这个实验没什么奇怪的,谷歌又做了第二个实验,就非常有意思。它把15台机器放在一起,用网络连起来,让它们同时来学同样的动作,每个人前面有一个盘子,放同样的东西,大家猜一猜学习时间变成多长了?变成了原来的1/15。
为什么呢?因为只要有一台机器抓到了第一个东西,它马上就把这个信息用网络传给所有机器,其他14台机器同时就学会了,大家想想我们人类能做这样的事吗?做不了。
也就是说你学会骑自行车了,你的兄弟姐妹还得从头学起,我没法把大脑神经元的连接取出来拷贝给他。这就是机器神奇的地方。
麦肯锡的研究表明,全球范围内多达1.4亿全职知识工作者或被智能机器所取代。到2020年,全球将会有700万个工作岗位消失。
美国斯坦福大学统计,美国将有47%的职位会被人工智能取代;而在中国,这个比例有可能达到60%以上!大量工作被取代的同时,意味着行业也逐渐被颠覆。
在人工智能这股飓风袭来之时,人工智能将能给哪些商业领域带来翻天覆地的变化呢?
1.自动驾驶
自动驾驶汽车实际上是一个会告诉自己正在行走的机器人。汽车最重要的零部件是电子元件,目前一辆车中的芯片成本将达到5000美元。一辆电动自动驾驶车本质上就是一台有四个轱辘的电脑。
传统汽车的核心能力在于将发动机、传统系统等机械子系统打磨成为精密的工艺品,但一夜之间这些核心技能不重要甚至不再被需要了。
目前的电动汽车的马达加速已经大大超过最好的汽油发动机,而且不需要任何传动系统。自动驾驶需要的重要技能例如计算机视觉、人工智能算法等都不是传统汽车厂商的强项。
第一次驾驶特斯拉半自动电动车的感觉就像第一次使用iphone手机,而驾驶传统汽车就像使用诺基亚手机。传统汽车厂商的营销渠道非常“线下”,依托于成本巨大的经销商、专卖店和维修体系。
电动车的车体就三样东西:电池、轱辘和马达。一辆内燃发动机汽车的零件有上万个,而一辆电动车的机械零件只有几千个。
这意味着发生机械故障的概率和维修成本降低。由于零部件的减少,电动车和电脑、家电一样将会变得标准化。这使电动车更易于在线销售,这将又一次冲击传统汽车厂商。
2.医疗行业
医疗健康是人工智能最热门的应用领域之一。医疗行业有太多的方面可以借助人工智能得到质的提升。医疗健康诊断和预测是一个典型的暗知识案例。
一个疾病的原因非常复杂,每个病人的身体情况和病史又都不同。人生活在一个超级复杂的环境中,环境中的所有因素都对人的健康有影响。
过去的医疗教育是把这些非常复杂的情况大大简化,编写成各种教科书和指南,但这些明知识根本无法覆盖所有的情况,所以一个好的医生主要是通过多年实践掌握了大量的默知识。
但由于人体的复杂性,每个医生掌握的默知识只是一点皮毛,无论是广度和深度都远远不够。
只有机器学习才能系统地通过数据挖掘出大量复杂的、医生通过自己经验和理解都无法触及的暗知识。这些数据不仅包括病人的数据,也包括生物、药理、生理、气候、环境等数据,机器能在这些复杂的数据中找出隐蔽的相关性。
机器将发现越来越多的医疗健康方面的暗知识,这不仅将从根本上改变未来的医疗诊断,也将深刻影响未来的医学教育和医生培养。
3.智能金融
人工智能将给金融行业带来彻底的颠覆。金融行业的重要分支例如银行、保险、证劵、理财将无一幸免。就拿银行业举例。
首先,银行面对消费者的大量业务和服务将被AI取代。例如贷款的审核方面,人工智能可以在贷前、贷中、贷后进行客户跟踪管理。
根据银行的征信数据加上社交的数据行为特征,可以精准地描述个人行为和金融风险。一笔贷款的申请和审核可以在瞬间完成,并且比人工审核的坏账率更低。
其次,AI将取代银行内部的大量人工运营管理工作。大型银行必须处理大量的数据以便生成财务报告,并满足合规要求。
这些过程都越来越规范化、程式化,但仍需要大量人员进行添加任务,比如对账和合并报表,他们的工作是机器人过程自动化(RPA)的理想选择。
最后,在接下来的几年中,人工智能将被用于改变财务中最核心的功能,例如公司间对账和季报,以及进行财务分析、合规分析等更具有战略性的职能。
人工智能提供了速度和准确性,例如,整个报告和披露过程可以和真实时间基本保持同步,不用再等到每个季度末期。
由人工智能支撑的财务团队能够比现在更快地发现问题并做出调整,从而提高准确性,而非每个季度的最后阶段才做努力。
就工作方面而言,托马斯·达文波特的《人机共生》中,给我们列举了以下3个特征,如果你的工作符合以下特征,那么,你被机器取代的可能性非常大:
1.无需动脑,只需大量的重复劳动,让人身心俱疲的工作;
2.无需天赋,通过训练就能掌握的技能,枯燥乏味;
3.两耳不闻天下事,一度认为只有人类才能完成,而机器无法胜任的任务,盲目自大。
现如今的人工智能从唐诗到写小说都有所涉及,甚至能模仿梵高的画风绘制出相同风格的画。
从这两张改造的画来看,机器的模仿可以说是惟妙惟肖,其中色彩、笔触、线条的模仿是人类无法企及的。这种模仿是典型的默知识,从这个例子可以看出机器对默知识的掌握比人类要精细得多。
这种“创作”在本质上是非常隐蔽的一种“混搭”,和作诗一样,普通人很难分辨真伪。
判断诗还可以用“意境”“画面感”,而判断画,特别是抽象画几乎没有人类可以依赖的直觉。作画机器人和作诗机器人不同,这里的作画机器人掌握的不只是默知识,而且进入了暗知识的领地。
所以由对抗生成网络这种机器“混搭”并迭代出来的画的确可以乱“真”。这样的机器可以在短期内大量探索不同的风格,让艺术家选择或给艺术家以灵感。
看完举例,是否有些心酸,为何机器如此强大,难道人类真的没有赢得过AI的地方吗。撇开情感,如果只讨论智力和智能,人比机器强在哪里?
但实际上,人工智能更像一个偏科生,比如像一个理工科大学招了一个体育特长生,跑步游泳可以拿全国冠军,但是考微积分不一定能及格。所以我给它的一个评价是什么?
它叫做智商偏科、情商为零,它完全不懂感情,所以情商为零。所以我们就可以看得出来,能不能取代我们人类?凡是需要情感的工作都很难被机器取代,包括保姆都很难被机器取代。
所以我们人类大可放心,机器擅长发现复杂相关性的那些领域,但是在很多其他领域,机器是很难取代的。
简单地说,虽然基于神经网络的人工智能在记忆和识别这两个基础智能方面超过了人,但在推理、想象等高级智能方面还和人相去甚远。未来最佳的结合就是人类和机器合作,互相取长补短。
今后10、20年是一个非常有意思的时代,我们可能会进入一个新的世界,这个时代我把它叫机器认知时代,机器认知时代有三个特点:
第一个特点,到处都有传感器,记录着我们周围很多的变量。
第二个特点,机器可以把大量的记录下来的变量从里头发现很复杂的相关性,然后用来为我们的生活、为我们的生产服务。
第三个特点,这些知识未来你可以想象有很多机器在不知疲倦地7×24小时工作,这些暗知识不断地积累,这个暗知识的海洋不断扩大,它会远远超过我们人类的知识。
这个神经网络也好、人工智能也好,是我们人类的一个很强有力的工具,和我们历史上发明的很多工具不一样的是,它延伸了我们的大脑,但是它毕竟还是我们的工具。
不管怎么样,未来的世界是一个非常未知的世界,欢迎大家来到这样一个未来的世界,和我们一起探讨这个新奇而又兴奋的未来!