编辑导读:近几年人工智能大热,几乎所有人都在讨论关于人工智能相关的话题,同时各个领域的突破也不少。本文作者对当前人工智能的目前发展情况进行了梳理,并分享了自己对人工智能未来的一些猜测与看法,与大家分享。
现在人工智能有很多突破,尤其在应用上有大量突破,但是实际上人工智能底层的技术研究的进展其实并不多。最近值得说的进展就一项,就是曾经研制出了AlphaGo,战胜了李世石的公司DeepMind。DeepMind在前段时间研究了一个系统,战胜了人类的德州扑克选手。
玩过德州扑克的朋友是可以感受到的,德州扑克要比玩围棋复杂得多。因为围棋所有的信息都是充分信息,是已知的;而德州扑克,你对面的玩家肯定不会让你知道他手里的牌,所以是不充分信息。在不充分信息的情况下能战胜人类选手,某种程度上说明人工智能又进了一步。
不过这种进步只是弱人工智能。正如《前哨》中所说:弱人工智能比人强,强人工智能比人弱。迄今为止在强人工智能方面还没有任何进展。
美国著名的计算机专家、图灵奖的获得者Judea Pearl的在去年的新书《为什么》中,就提到了一个很有趣的,甚至让人工智能专家都有点尴尬的事实:“人工智能评价这个系统的好坏,并不能从结构上或者理论上来评价,比如你的结构更优或者理论更好,只能从结果来评价。”人工智能算是一门科学吗?答案成疑。所以Pearl就很毒舌地说:“人工智能现在已经变成了炼金术。”
所以人工智能在现阶段最大的瓶颈,就是理论上和实际底层技术的发展。
下面是笔者在读《为什么》时的笔记导图,强烈建议对人工智能感兴趣的朋友读下原书。
虽然面临着理论和底层发展的瓶颈,人工智能终究还是有进展的,根据王煜全老师在2019年的报告中的阐述,结合笔者对人工智能领域的理解,可以总结为以下三个发展方向。
过去机器学习要用海量数据做训练,现在希望用尽可能少的数据做训练。
小数据不等于没数据,因为人工智能迄今还是基于归纳总结原理做出来的,也就是说在人工智能系统里面其实统计学更有意义。
但人工智能绝不能满足于此,人类是会推理的,可以在没有数据的情况之下判断事情该怎么做,小数据也不能真实模拟人类的这种判断。
我们可以想象这样一个场景:在一个雨夜里,你在一个崎岖的山路上开车,前面路中间有一堆土,土堆边上有一个看似穿着警服的人在挥手,摇着一个旗子让你下来,你下还是不下?如果你不下,勉强可以冲得过去,但如果你下来才是遵守指令。这种时候,我们普通人会有很复杂的推导,比如这附近治安好不好?晚上天很黑的时候附近治安会不会有问题?另外我们人会看这个警察,他身上的装扮是不是真正的警察制服?周围的交通疏导装置是不是都安上了?如果只有一个人站在那,而没有相应的交通疏导装置,很多人会认为这是假的,就会想办法冲过去。
这些所有背后的复杂判断,不只是一个路面的问题,而且涉及到了社会安全,以及很多其它和交通无关的问题。这些问题是迄今为止自动驾驶都无法判断的。
这也就是五级自动驾驶几乎接近于永远无法推向市场实现商业化的原因。除非下一次人工智能的突破到来,使得人工智能真正具备智力分析能力。虽然现在人工智能的一个方向是小数据,但依然不是没数据,依然是基于统计,而不是基于推理和因果关系,这也是《为什么》这本书质疑人工智能的地方。
笔者不是技术出身,对计算能力上的概念理解也是有限,简单描述下该方面的发展方向。
从计算能力上来说,一方面,我们要有充分的计算能力;另一方面,5G的来临使得我们的云端计算能力也可以得到极大的加强。而且因为响应速度提升了,所以云端计算能力可以对局端、对边缘的计算能力实现更好的补充,使得云端和终端形成一体化的人工智能计算能力。
这其实对整体来讲是锦上添花,而并不是一个革命性的变化。
现在机器也可以终身学习了。
机器一旦有了终身学习能力,就会使得我们整个人类或者说企业,尤其是行业里面采用人工智能的策略产生本质性变化。如果机器不能终身学习,我们在引入人工智能的时候就不用太着急,等到人工智能系统足够好的时候再引入即可。但是如果机器能够终身学习,最好的策略是第一时间引入人工智能,因为虽然引入的时候它可能还不那么智能,但是它不断学习、不断完善自己,就会比引入晚的竞争对手领先一大截,这个时候甚至和硬件都没有那么大的关联。
所以,各个行业都需要去看人工智能能否更快、更好地引入到自己的行业领域里面来。因为人工智能确实是像互联网一样,所以很多人都说人工智能是互联网的下一代,就是因为它有广泛的适用性,所有的行业都有可能因为人工智能而获益。
现在采用人工智能还是有一些障碍的,尤其是对于不是这个行业领域的公司。一些传统领域的公司通常认为,建立了人工智能部门,也招了很多做人工智能的人,就是在做人工智能了。但实际上迄今为止,人工智能专家依然是稀缺的,人工智能专家在未来五年之后可能就不再稀缺了,但是现在依然是稀缺的。
稀缺的一个主要的特征,就是很多大IT公司都在喊:现在和我们抢夺人工智能人才的,主要的竞争对手是华尔街。为什么呢?因为人工智能技术基本上到顶了以后,你就可以判断它在单项上有很强的优势。这种单项优势就会被各个行业领域采用,最早采用的一定是利用这个优势获得大量收入利润的行业,金融无疑是最理想的行业,所以用人工智能炒股已经几乎变成华尔街的标配了。
虽然独立的人工智能炒股的基金公司并不多,但实际上,大多数的基金公司都储备了人工智能的人才。判断短时的涨跌,用人工智能做短期操作一定比人强,这已经是事实了。当然,这并不代表人没有机会,因为现在单项上人工智能比人强,但是多项综合人就显著地占有优势。
如果你判断短期的股票交易,基本上就根据以前的交易行为来判断,那一定是机器比人强;但是如果判断一个企业的长期发展,尤其是判断一个企业未来的科技产品有没有可能在未来的科技市场当中占优,机器就不一定比人强。
因为这些判断是非常综合的事情,涉及到了科研发展的趋势,包括研发的进展、技术能力的变化,包括产业格局的变化,甚至包括企业经营特点的变化,还包括市场的接受程度、用户的变化。
从这个意义上讲,人工智能相对来说是判断不清晰的。也就是说,你问人工智能明天可不可以买一个股票,它的回答一定比问一个人要好,但是你问一个公司五年之后发展得好不好,你最好去问人类的专家。这说明人还是有机会的,不要和人工智能去争夺单项的长短,而要在综合上面取得优势,甚至每个单项上都用人工智能辅助我们,但是在整体上我们可以超越人工智能。
这是一个相对来说比较特例的地方,因为人工智能能为企业带来大量的钱,所以整个华尔街现在非常欢迎人工智能专家,以至于现在很多IT公司都把华尔街当成竞争对手,这个竞争指的不是市场的竞争,而是指人才的竞争。而随之而来的,大多数情况之下,人工智能专家不太愿意去传统行业的企业,因为传统行业往往有很长的研发周期,它不像短线炒股,研发周期很短,迅速就有结果。
现在中国的人工智能有一个很大的问题,就是过热了以后产生了一批人工智能独角兽。
独角兽就是还没有上市,但是估值已经超过了10亿美金的公司。我们都知道很多公司其实估值不到10亿美金就可以上市了。但是这些独角兽之所以没有上市,是因为收入利润并没有清晰地显示出来,也就是说其实它还不符合上市指标。但是因为市场热捧,所以它的估值非常高,这样的话这些企业就会有特别强大的压力。
压力体现在两方面:
一方面,它必须要持续不断地从市场网罗人才。因为它是独角兽,它给期权的时候会显示期权的价值特别高。虽然这个期权显示很高,不代表员工真正获取了这个价值。但是市场承认这个价值,所以它就会对人才形成很强的吸引,造成现在很多的人工智能人才愿意去独角兽,因为有高薪又有高期权,而不愿意去传统行业。传统行业的薪水没那么高,而研发又需要一个周期,不能立竿见影看到效果,回报产生了落差,因此大多数人会选择去独角兽企业。
独角兽企业有另一个致命的问题,因为它估值过高了以后,就要尽快地在收入利润上兑现它的承诺。这就意味着这些独角兽企业在长期研发上投入不足,同样是盯着那些眼前最能赚钱的业务,人工智能现在最能赚钱的业务是什么呢?这其实也是大家普遍关注的一个话题。
因为人工智能在去年、前年就在喊这样一个话题了,今年甚至还会再继续喊,就是所谓人工智能叫好不叫座。虽然人工智能非常热,各种新的应用层出不穷,但是你去看人工智能企业,似乎它们收入利润的增长没有那么令人满意。
该层级主要是涉及人工智能相关的硬件企业。这些企业坦白讲其实未来还很难预测,做这种专业领域的研发(FPGA)的公司机会相对还大一些,现在做类脑计算芯片、人工智能计算芯片,通用性相对强一点,压力会比较大。因为实际上这种芯片是需要构筑生态的,这种芯片的一个领军企业就是NVIDIA(英伟达)。
英伟达有几千个工程师,去帮它的芯片做各种应用的场景开发,或者是应用的支持,加强了英伟达的生态的健全。例如,同样做自动驾驶解决方案,英伟达更看重的是,我如何能让客户得到全面的服务。基于此,英伟达做了一套虚拟的试车系统。这套虚拟系统,让自动驾驶系统在虚拟路面去跑,可以把速度倍速。另外,可以同时在多个虚拟环境跑,显示好像是有100辆车、1000辆车同时跑,很快地积累到了足够的里程,由此人工智能系统就足够地强壮、足够地智能了。
这就是它对环境的构建,这是非常重要的。而国内大多数芯片企业,只是盲目地强调自己计算能力的优越,没有这种生态构建的能力,其实是很难跟英伟达竞争的。当然英伟达也有一个缓慢的苦尽甘来的过程,其实在两三年以前黄仁勋在演讲时,他还在畅想人工智能在各个行业领域的突破,非常地发散,但是到去年的时候业务已经非常地聚焦,一定能实现足够大的收入利润。
这个层级主要聚集着在基础平台和基础应用上发力的企业,比如云计算提供者。
在美国几乎所有的IT巨头都花巨资去建立大的云计算平台,而且都要有强大的人工智能的支撑能力,其中最领先的就是亚马逊的AWS和谷歌这两家公司。所以这几乎变成了一个业内共识,未来云计算+人工智能,甚至到了5G以后,使得云计算+人工智能无所不在,成为标配,很快就会发现人工智能会像自来水一样,随处都可以获得。
中国也是一样,现在比较领先的就是阿里云,腾讯、百度也在发力,但是现在看起来阿里还是比较领先的。当然华为也在做自己的云。中国也会诞生几朵大云,也有很大的市场空间,因为中国的IT市场不比海外小多少。
所以这一层会发展起来。而这一层的核心就是除了提供基础的云计算能力以外,一定要提供一些附加的人工智能能力。而这种人工智能能力就会使得人工智能的基础应用,不是由人工智能提供商来提供,而是由云平台直接提供。
什么是基础应用呢?现在其实没有明确的定义,在此笔者举出几个例子,供大家了解与讨论。
视觉识别,包括面部识别会变成基础应用。因为在更多公共场所的监控加上视觉识别之后,可以快速抓捕逃犯,有助于社会治安。这就形成了一个巨大的市场,现在大量独角兽都在追逐该市场。
但从长期来看,这个市场对于独角兽们恐怕不是很友好:一方面,政府会形成统一的大市场,未来应该是打通的,就从全国到处都是客户变成一个客户,这个市场也就某种程度上不存在了;另一方面,不管是几个客户,提供者很可能都不是今天的这些独角兽们,而是由基础云平台直接提供,比如阿里、腾讯或者是华为这个量级的企业。
主要原因就是这个能力并不复杂,尤其有了云以后,从云上直接提供是最简单的,未来各地只要有摄像头,就可以利用云端的能力实现智能的面部识别或者是图像识别的功能。
除了面部识别以外,现在一个大热点就是动作的识别,甚至把它叫做动作指纹。我们每个人的步态、动作、姿态都有自己的特定规律,经过人工智能的分析,可以只通过我们的动作就知道这个人是谁。现在还有一个特点,就是跨摄像头、跨领域的连续分析。也就是说通过动作捕捉,你可以跨多个摄像头,这就可以了解一个人的行为轨迹。虽然这个人的脸并没有被识别,但是通过动作就可以识别出来。虽然今天人工智能还是作为科研任务在搞,但是很快就会变成一种基础能力,通过云计算提供出来。
除此以外,还有一些基本的图形识别能力,包括另一个热门的市场,就是医学的图像识别。医学里面X光或者B超这样的图像识别,未来很有可能也会被整合到云端,提供者可能是第三方公司,也可能是云端的大IT服务商,但是未来都会由云端来提供,这也变成基础服务了。
最后,语音语义识别和翻译未来很有可能也变成云端的基础服务。今天如果你要翻译的话,还需要随身带翻译机,但是其为什么不是整合到手机里呢?据搜狗的CEO王小川介绍,搜狗的翻译机里有6个GPU,这样使得它翻译的时候计算能力能够跟得上。但是未来如果云端的处理能力加强了,所有这些语音全部送到云端去处理,然后把结果返送回来,这种时候我们每个人的手机就可以是翻译机了,而不需要一个单独的设备。
根据上文,很多基础能力未来很可能都会变成一个云端提供能力,而真正的应用能力应该是不那么基础、不那么通用,而且和行业要有充分结合。虽然它也会用到很多基础能力,甚至是云端的基础能力,但是因为它有行业特异性,所以不是云端这个云提供者能够提供的。
比如,因为语音语义识别的成熟,包括翻译能力的成熟,结合行业所组成了一个已经启动的市场,那就是智能客服。呼叫中心小企业虽然不像大企业一样有呼叫中心,但是其实有呼叫中心的需求。现在如果用人工智能来做呼叫中心,回答用户问题的并不是一个人,而是一个人工智能系统,小企业也可以通过租借或者购买这个SaaS系统来满足自身需求。所以这个市场会迅速地崛起,甚至呼叫中心市场会繁荣,但是呼叫中心那些接电话的人会失业,这是冷冰冰的事实。
其实很多人工智能系统都是这样的,自动驾驶会繁荣,意味着车可能会更多,而不是更少,但是司机可能会失业。
这个层次会有大量的人工智能相关的应用公司繁荣起来。这些应用公司很明确,一定要有自己本行业的特色,因为、人工智能这个技术本身没有办法形成壁垒,真正能够形成壁垒的地方一定是行业,也就是说行业数据、行业经验和行业准入会是你的壁垒。这需要我们去找到这个壁垒,从而把业务做起来。
所以任何先进领域不代表只要领先就好,还必须找到自己的壁垒和竞争优势,才能够做得好。