这是傅一平的第298篇原创
作者:傅一平
个人微信:fuyipingmnb
最近阿里云发布了《中国企业2020: 人工智能应用实践与趋势》白皮书(文末有PDF获取方式),作为企业2020年应用人工智能的落地指南,并总结了人工智能为企业创造价值的七大模式。
笔者是做大数据的,但跟人工智能有着千丝万缕的关系,工作中的一个很大体会是虽然做事要细,但技术站位要高,新技术领域最怕的是不知道自己不知道,做正确的事比正确的做事可重要的多。
看完50页白皮书,说其能用来指导人工智能落地有点托大,但却有益于你较为全面的了解人工智能的发展脉络,有些概念的诠释也比较清晰,有些观点还很有新意,因此还是值得读的,如果你没时间,就读我的这篇概述吧。
我把《白皮书》的核心内容整合成四大部分,第一部分数字经济的背景,第二部分人工智能是数字经济时代的新生产力,涉及算法、算力、数据、云计算等技术趋势,第三部分人工智能创造价值模式,第四部分企业应用人工智能的关键思考。
一、数字经济的背景
为啥要讲数字经济?
因为人工智能是数字经济的一个技术基础,不讲数字经济的重要性,人工智能就失去了现实意义。
1、数字经济的概念内涵
数字经济两个核心引擎: 数据智能技术+网络协同效应。
数据智能技术是谷歌等巨型数字经济公司崛起的第一推动力,网络协同效应是这些平台型公司扩张的关键范式,网络协同沉淀了海量数据,数据智能技术则实现了精准的体验,具体关系见下面这张图:
何谓数字经济?
数字经济是以数据为生产资料,云计算、大数据、人工智能等技术作为生产力,利用算法和算力,将数据转变为价值的一种新经济形态,如果你对数字经济不理解,可以好好读读这段定义。
为啥其发展空间巨大?
现在,我国的数字经济相比第一,第二,第三产业的规模小太多了,比如2016年我国软件产业收入规模4.9万亿,而规模以上工业企业主营业务收入115万亿,假设人工智能和大数据工业数字化融合的效益为行业提升4%,其增量就将超过整个软件行业规模,这你就能理解为什么现在大厂都疯一样的入局产业互联网。
2、数字化创新的四个方面
数字化后能带来什么改变呢?
(1)产品和服务创新
通过数字化技术,企业能够对现有产品服务进行数字化改造升级,将传统的与客户没有连接、没有数据回路、没有智能服务能力的产品,改造为数字化、智能化的产品,满足消费者对产品能力升级的需要。比如智能音箱,它就具备了数字化的几个特点:与电脑和网络连接,将声音数字化,通过人工智能识别并遥控。
(2)客户体验创新
从优化与消费者的触点触发,通过新技术、新形态为消费者提供创新的体验,通过沉淀的数据分析,更好的洞察消费者需求,让消费者感受到体验创新。比如支付宝的刷脸支付就是触点体验提升的典型案例。
(3)业务模式与工作流程创新
通过数字化、智能化的方式,构建起自动化、人力少干预、流程高并发的业务模式与工作流程。比如酒店基于入住率分析自动化调整价格的创新业务模式。
(4)内部IT创新
其实就是办公自动化提升效率,比如钉钉的电子审批。
3、数字化创新的基础设施和关键技术
讲完了概念和价值,开始讲依赖的技术,下面这种图叫全域创新模型,一看就懂。
全域创新模型的核心关键技术如下图所示,物联网负责数据记录和采集,将物理世界数字化,互联网+移动互联网让数据的流动代替了物质的位移,能够让人们超越时间和空间进行协作,区块链让这些数据的流动变得更为可靠和公平,有了无处不在的海量数据还不够,还需要无处不在的云计算提供廉价的算力,而大数据技术让算力变得更为高效,机器智能则将数据转化为最终价值。 你看,这些技术环环相扣,缺一不可。
《白皮书》认为大数据,机器智能和云计算则共同搭建了数字经济的最核心引擎,是当前数字经济模式最核心的关键技术,其实这有站位问题,换成运营商来讲,肯定要提到网络是数字经济模式的最核心关键技术,特别是5G。
《白皮书》特别解释了机器智能与人工智能的区别,显然是因为马云说了话,人工智能强调让机器模仿人,机器智能更加强调让机器做人做不了的事情,从长远来看,人工智能只是机器智能发展的一个中间阶段,机器的智能能力必将超越对只是模仿人类智能的水平。
其实从事这个行业的都知道人工智能不用望文生义的去解释,但马云显然是站在普及大众的角度讲的,这种用户思维挺好。
二、人工智能是数字经济时代的新生产力
1、数字经济时代的人工智能发展现状
(1)人工智能投资逐步降温和盈利困难
这很容易理解,比如2018年90%的人工智能公司处于亏损状态,看得到的能赚钱的人工智能应用很少,算法使用费也很廉价。
人工智能跟大数据一样,其发展的瓶颈在于对于垂直行业的理解不够,渗透不够,但我相信人工智能和大数据会一同起飞。
(2)无监督学习正在突破通用智能
这个论断有点言过其实,但监督学习的困境是实实在在的,你看现在漫天飞的招聘人工智能标注师的广告就知道了。
(3)实时强化学习收到追捧
这个让人眼前一亮,其提到实时强化学习是强化学习的一个分支,实时强化学习能够为推荐、营销系统带来强大的技术升级,用户反馈分钟级回流回来,在线更新模型。
笔者有同样的感受,很多模型运行一段时间效果就下降了,运营的成本很高,迫切需要模型的自动迭代能力,记得当时还做了逻辑回归的自动迭代的尝试,但后来没坚持下来。
(4)对实时决策的需求推动边缘人工智能发展
这个是根据边缘计算的特点推理出来的,因为边缘计算就是要解决数字化业务的本地快速智能决策问题,比如在监控摄像头上运行人脸识别算法就可以快速提供安防威胁识别,而传到云端的代价就太大了。
2、人工智能算法的演进趋势
讲述了人工智能算法的演进历史,一波三折,从发明感知机用于识别分类,到发现表征非线性关系的困难,再到分布式的网络发明,再到神经网络参数的训练难题,再到反向传播算法(BP)的发明,最后却发现无法带来较好的回报,中间还有专家系统的插曲,直到人工智能第三次的回归,而这主要得益于深度学习算法的突破、互联网海量数据的积累、存储成本的大幅下降及算力的大幅提升。
深度学习算法突破的标志性事件是其图像识别错误率在2015年超越了人类的识别率5%,下降到了如今的2.3%。
要清晰的了解这段历史,显然《白皮书》是不够写的,推荐一本书:《深度学习:智能时代的核心驱动力量》
3、人工智能算力的发展趋势与洞察
前面提到BP算法是如今人工智能领域深度学习神经网络的重要突破之一,但无论是BP算法还是十年后与卡斯帕罗夫展开历史上首次“人机大战”DEEP Blue,人工智能在当时严重的受到了算力不足的影响,很多人工智能业界的专家认为,在弱人工智能时代(现阶段),算力是最重要的人工智能发展影响因素。
(1)异构计算在崛起
随着算力需求的暴增,对算力的合理利用和不同计算单元的协作就变得日益重要,将CPU、DSP、GPU、ASIC、协处理器、FPGA等各种计算单元、使用不同的类型指令集、不同体系架构的计算单元组成一个混合的系统执行计算,让每一种不同类型的计算单元都可以执行自己最擅长的任务,从而大幅度提高人工智能计算的效率和速度。
CPU、CPU领域存在大量开源软件和应用软件,任何新的技术首先会用CPU实现算法,通用性很强,而且CPU编程的资源丰富而且容易获得,开发成本低而开发周期短。
FPGA采用Verilog/VHDL等底层硬件描述语言实现,需要开发者对FPGA的芯片特性有较为深入的了解,但其高并发性的特性可以使业务性能得到量级的提升,同时FPGA是动态可重配的,当在数据中心部署后,可以根据业务形态来配置不同的逻辑实现不同的硬件加速功能。
ASIC芯片可以获得最优的性能,即面积利用率高、速度快、功耗低,但是ASIC开发风险极大,需要足够大的市场来保证成本价格,而且从研发到市场的时间周期很长,不适合例如深度学习CNN等算法正在快速迭代的领域。
(2)GPU是人工智能主要算力供给
越来越多的人工智能计算服务器开始使用8 GPU或者16 GPU卡,是当前AI基础架构领域的主流,销售额占比达到99%,此外,GPU计算正朝着“Non-CPU”方向发展,即不需要计算系统中使用CPU,用户可构建起完全由GPU组成的计算系统。
(3)传统高性能计算与人工智能融合
AI站在先进计算的肩膀上会走得更远,事实上,类似的尝试早在超算领域就已经被证明是可行的,比如,美国计划在2021年建成的E级计算系统Aurora据DOE所披露的信息显示,就已经是一个先进计算系统,它不仅仅支持计算密集型应用的传统超算,也将支持或者说针对数据密集型分析应用进行优化(预计也会包括针对深度学习的优化),换句话说,Aurora是一个可以支持AI代码的先进计算系统,它将支持深度学习负载。
(4)边缘人工智能算力持续提升
随着物联网边缘设备对人工智能能力要求的不断提升,对即时、高吞吐量的边缘人工智能算力的需求也在持续增加,边缘设备需要借助人工智能及与之匹配的算力,即时做出分析,判断和决策。
4、数据与人工智能的关系与趋势洞察
众所周知,在数据量非常小的时候,深度学习的复杂网络无法取得很好的效果,辩证的讲,数据不是一种无限的资源,而人工智能所需的数据相当昂贵和耗时,一方面深度学习需要准确的标记图像或文本训练数据,而标记需要大量的人力;另一方面,许多数据存在着隐私和安全风险,比如说医疗等等,而数据的开放不是短期内能解决的。
现在数据孤岛、数据隐私、小数据和标注等问题日益突出,当前人工智能要能进一步发展,必须解决数据的挑战,找到在当前的数据状态下可持续发展的方法。
这就是人工智能专家吴恩达提出的问题:“数据当然是越多越好,我也并没有说许多数据是无用数据。但是,在农业、制造、医疗等领域的部分应用场景中,如果你手头只有100张照片,比如肿瘤照片过少,怎么办呢?”
笔者也碰到很多这种情况,比如反欺诈样本过少的问题。
“小数据、大智能”,是用小数据推动人工智能技术能力提升的重要课题,在这一领域已经有了一定的探索。
联邦学习:一种跨多个数据源的模型训练方法,训练的各方的原始数据保留在本地,只有参数进行交互,通过加密模型训练得到最终的优化模型,从而解决数据孤岛的问题,笔者有一篇文章专门介绍《联邦学习,带我们走出“数据孤岛”的困境?》。
笔者也组织团队进行过尝试,但关键的问题是联邦学习业界还没有达成安全的共识,没有第三方中立机构为你背书,机制和流程仍然是很大的挑战。
合成训练数据:没有训练数据,没有大规模的标签数据集,那么就尽可能逼着的仿造数据,这就是合成训练数据,但并非是毫无根据的模仿,合成的训练数据一定是可以精确地模拟现实场景和现实事物,最简单的比如图像识别数字,为了防止过拟合可以将样本进行旋转扭曲等操作来生产更多的样本。
仿真系统也可以部分的解决这个问题,比如英伟达在2018年月推出DRIVE Constellation仿真系统,用以生成在虚拟世界中车辆行驶的传感器结果,又比如运营商可以基于MR(测量报告,代表了手机信号电平信号强弱)信号的仿真来进行高精度的指纹定位,其实本质上就是利用模型和算力来生成逼真数据流。
对抗学习:利用(GAN)生成或增强现实世界数据,利用混合现实和模拟数据来进行训练,从而形成更大规模更多样化的数据集,也是当前这个领域正在进行的工作。
迁移学习:“触类旁通”可能是最适合描述迁移学习的成语,这是一种通过已学习的相关任务中转移知识来改进学习的新学习方式,比如说,用于识别苹果的训练成果可能会有助于识别梨,迁移学习强调不同领域之间通过知识迁移,来完成原本较难完成的任务,从而在缺乏已标记数据时,利用迁移学习借助其他相关领域的知识,来帮助训练更具有泛化能力的模型。
但数据问题的解决显然不能光靠技术,从代价和效益的角度讲,推动组织、机制和流程的改造很重要。
5、云计算,基础设施与能力赋能平台
云计算成为数字经济发展的重要基础设施,也是人工智能发展的重要基础,相比工业经济,新数字经济的重要特征是以数据为重要的生产资料,以云计算、大数据和人工智能技术为主要生产力,以互联网和移动互联网为主要生产关系,以数字世界的数据智能技术与物理世界和实体经济的深度融合,让数据创造出新价值。
云计算作为驱动数字经济技术发展的心脏,作为数字经济的基础设施,并未人工智能发展提供强大的算力支持以及数据存储资源。
当前,云原生架构基本完成了IT架构在云计算时代的进化升级。以轻量级的容器、松散耦合的微服务、通过API进行交互协作,通过DevOps流程进行管理的为代表的云原生技术以其高效稳定、快速响应的特点驱动引领企业的业务发展,帮助企业构建更加适用于云上的应用服务。
现在通信行业的云化进行的如火如荼,极大改变了传统IT支撑模式,比如笔者团队现在要申请些应用资源,全部都是容器申请了,而5G时代,运营商的核心网络也将被云化颠覆。
从产业发展看,从消费互联网到产业互联网的演进是数字经济的创新主战场,云计算作为信息科技领域的水电煤,其公共属性将愈发明显。
三、人工智能创造价值模式
讲完了数字化的背景、人工智能的技术趋势,这里重点谈人工智能创造价值的模式, 主要有七种:
1、取代重复性简单工作
人工智能的应用有一个几乎必然会发生的现象就是取代人类目前从事机械的、简单的、重复的和毫无创意需求的劳动。比如工业机器人和机械臂。
2、创造数字经济时代新物种
从目前的技术及技术伦理来看,“类脑智能”等还为时尚早,但人工智能结合云计算、物联网、VR/AR等技术,确实能够解放和重构生产要素,催生各种商业社会创造“(产品、服务或企业类型方面的)新物种”的能力。比如翻译机诞生的背后,就是机器翻译水平的大幅提高。
3、突破人类能力极限
随着计算机的普及,计算、存储和算法正在逐渐超越人类在全局认知、高并发性、深度逻辑和复杂准确记忆的能力极限,提供全新的生产力。此外,在一些高度危险、高度复杂的生产环境中,人工智能也能肩负起突破人类能力极限的重任。举例来说,人工智能在卫星遥感影像翻译中的应用可将传统解决方案需要的几个月缩短至几个小时。
4、激活数据,创新业务和商业流程
过去20年,中国企业普遍进行了信息化和电子化,沉淀出大量高价值数据,这些数据都可以通过人工智能“激活”,从数据中找到新的业务价值点、业务流程或客户需求,帮助企业比现在的人工做出更好的业务服务和业务流程。举例来说,利用运营商的语音数据可以更深刻的理解客户的情绪和诉求,从而提升客户服务质量。
5、精确匹配并找到被忽视的潜在逻辑与联系
人工智能具有的强大数学能力和足够的计算速度,已经远远超过人类的计算承载力,可同时处理上百万种情况,这种能力能够突破“老专家”式的传统思维定式,将隐性和碎片化的问题变得显性化,并由此生成新的知识。比如Palantir独角兽反恐公司可以从邮件、社交网络信息、网络日志信息数据中挖掘和展现出未知的相关关系,为决策提供依据。
6.、提供全新的人机或服务交互模式
目前人工智能在机器视觉(图像和视频识别)、自然语言理解和语音识别等领域已经具有非常强的能力,并随着深度学习技术的发展,这意味着机器可以拥有近似于人类的“视觉、听觉和语言/语义理解能力”。新的、规模巨大且有利可图的人机交互相邻市场正在开放,特别是在汽车和医疗领域,有了新的增长和扩展机会,人工智能将是革新人机交互的新起点。
7、辅助人类智能决策
人工智能能够为企业提供与传统的决策支持系统、知识辅助决策系统或专家系统不同且更具价值的智能决策,帮助企业构建决策支持系统(即Decision Support Systems,DSS,是人工智能的重要研究领域),为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。
四、企业应用人工智能的关键思考
1、人工智能终极目标是创新数据智能商业模式
企业最应避免的是为了应用人工智能而用人工智能,人工智能不应成为企业炒作的一个热点,从长远来看,单点的人工智能的应用无法形成企业独特的竞争力。
这一点笔者很认同,人工智能技术的应用是数字经济商业模式的发展的必然结果,如果一个企业的业务形态是靠数据和算法对外提供服务,那么它一定需要应用人工智能技术,并发展出自己这个行业独特竞争优势的人工智能应用,从而带来更好的用户体验和商业上的成功,业务模式转变是因,运用人工智能技术只是果。
很多企业业务没有想法,IT很单纯的希望用人工智能技术创造出新的应用场景,这就变得本末倒置,对于传统企业来说,运用人工智能技术的终极目标是在这个行业中创新实现算法和数据驱动的新的商业模式,将人工智能应用嵌入到企业核心的生产和经营过程,人工智能技术首先带来的是商业模式的变化。
好比做大数据,如果你的营销流程未发生变化,仍然是业务人员提出数据需求,然后由后端人员用人工智能算法获得更精准的用户群,最后再交给业务人员进行投放,我还是认为你的商业模式并没有发生太大变化。
但如果你改变了营销投放的流程,直接将投放权利交给了人工智能算法,我觉得这可能就是一种新的商业模式。现在很多所谓的人工智能应用就是打个补丁,对于企业的生产力提升非常有限。
2、智能应用人工智能是CEO需要负责的事情
人工智能事关企业商业模式,是需要CEO亲自抓的事情,人工智能应用不是一个项目,而是数据智能业务转型的一个长期过程,因此人工智能的应用,必须从集团长期发展规划、战略、组织、人才去通盘考虑,甚至要根据数据智能驱动的业务转型的远期目标倒推,而这些都是CEO需要做决断。
这个道理跟做大数据类似,大数据首先是一把手工程,比如浙江移动的大数据智慧运营,其能获得进步首先不是建成了什么大数据平台,而是首先需要将智慧运营纳入企业的战略,要进行与之适配的机制、组织和流程上的创新,很多最佳实践复制不了,根子不在平台工具上,而在于战略、机制、组织、流程和人才跟不上,是企业的管理水平问题。
当然,在应用中要允许试错,所谓“看十年、做一年”,十年后某个行业数据智能驱动的新商业形态到底如何,没人能够看得清,唯有依靠短期的不断试错不断调整才能获得未来的成功。
3、人工智能应用优先从新问题,新痛点着手
这个跟《创新的窘境》这本书描述的道理一样,新的人工智能应用面对企业的存量业务受到的阻力是巨大的,对于传统企业来说,长远目标是创新行业数据智能驱动的商业模式,但是在推行人工智能应用搞得起点项目上,选择从新问题和新痛点着手,对现有部门利益格局影响小,受到的反对阻力相对小,试错成本也相对较低,一旦起点项目获得成功,存量业务的转型也就有了机会。
写到这里,《白皮书》前30页的精髓就已经差不多了,后面的20页基本都是人工智能在各个行业的应用案例,这里就不累述了。
笔者的总体感觉就是这个《白皮书》给了你学习和理解人工智能的一个纲要,让你能够跳出自己的专业俯瞰全局,然后再有的放矢的进去,这个对于完善自己的知识体系有好处。
即使你是这方面的专家,认真读下来相信也会有收获,当然读透它也是需要花时间的,读第一遍的时候,会感觉不过如此嘛,第二遍精读的时候,就有点感觉了,或多或少会发现点价值,读第三遍的时候,则一定会有更多的意义显现出来。
注:如需《白皮书》PDF版本,请帮忙在朋友圈分享这篇文章,然后加我(微信号:fuyipingmnb)为微信好友索取即可。
假如你有独到的见解和意见,欢迎到我的知识星球进行探讨,如果你觉得有用,欢迎推荐和转发。
完
作者:傅一平 (微信号:fuyipingmnb)
可能错过的近期精选文章(点击链接即可阅读)
从芝麻信用分透露的详细数据设计,我们能从中得到什么启示?
艰难的旅程,你的数据中台到底能为一线提供多少火力?
超越平台,数据中台的业务化、服务化及开放化!
PPT,考验你的格局、能力和思维的方式,你得学会驾驭它!
读透《阿里巴巴数据中台实践》,其到底有什么高明之处!
如何避免成为一台取数机器?
哪些广为人知的数据挖掘案例其实是一地鸡毛?
数据的价值到底如何评估?
为什么我提交的数据分析报告总是被领导K?
我如何用统计学指导自己的生活?
从吴军的“算法的油水就那么多”说起!
中国移动集中化大数据平台起航了,意义深远!
一起成长,让我们与数据同行
忙完工作,偷得浮生半日闲,讲述自己的数据人生
大叔/电信博士/500强央企/大数据/人工智能/统计取数/数据挖掘/数据产品/数据管理/数据仓库/数据变现