自2016年谷歌的阿尔法狗(AlphaGo)让世界围棋冠军李世石认输的那一刻起,人工智能便再一次成为社会各界关注的焦点。2017年,人工智能更是迅速升温,成为政府、产业界、科研机构以及消费市场竞相追逐的对象。在国家人工智能战略和资本市场的推波助澜下,人工智能的企业、产品和服务层出不穷,创业创新日益活跃。
这一次人工智能浪潮的到来得益于强大的计算能力、先进的算法、大数据、物联网等诸多因素。实体经济数字化、网络化、智能化转型给人工智能带来巨大的历史机遇,展现出极为广阔的发展前景。
实际上,早在2011年,IBM就进行了第一次人机大战,IBMWatson超级计算机在电视节目“Jeopardy”问答游戏中战胜人类选手,赢得那一次在美国的边缘挑战节目。此后,IBM用Watson这个品牌打造了IBM在AI领域的发展战略。
2017年,IBM进一步明确了发展“商业人工智能”的战略,并在电子、能源、教育、汽车、医药等各行业领域取得良好应用成果。近期,大数据周刊专访了IBM全球杰出工程师、人工智能系统技术总监、IBM中国研究院林咏华女士,她让我们了解IBM的AI发展历程,并详细阐述了企业在发展AI过程中面临的种种挑战以及如何应对等难题。
看点
01
IBM的7年AI之路
IBM在人工智能和认知计算领域有着多年研究和积累,人工智能这个学科最早建立在1956年的达特茅斯会议上,而IBM就是这个会议主要的参与者。多年来,IBM一直在这个领域投入人才和资源进行研究探索,直到IBMWatson超级计算机击败“危险边缘Jeopardy”人类选手而震惊世界。
最近几年,IBM在人工智能领域取得可喜可贺的成绩。最新数据显示,IBM对AI和云服务的投入已收到回报。在2017年10月18日IBM公布的第三季度财报中,以这两个方向为主的战略性业务(StrategicImperatives)营收增速达两位数。第三季度,云服务营收增长了20%。在过去12个月里,云服务营收增长到158亿美元规模,占IBM总营收的20%左右。
林咏华对IBM过去六、七年中在AI领域的发展经历做了详细解读,让我们看清IBM是如何走过AI之路的。“IBM在AI的发展中,我认为是有三条轴线的。第一条是处于中间的AI技术核心中轴线。大家今天看到的许多跟AI技术相关的报道(包括IBM和其他公司),其实都围绕着这条中轴线。在这条中轴线上,IBM做了大量创新和研发。首先,我们的AI技术与产品很大一部分是部署在云平台上面,包括公有云及企业私有云。AI应用带来了巨大的新计算需求,导致GPU、FPGA,甚至TPU这样的硬件加速器技术需要部署在云上面,因此这对云计算技术带来了新的技术需求。”她说。
围绕这条核心中轴线,IBM还做了跟AI相关的多个重要领域的研发,林咏华指出,这类研发包括语音、计算机视觉、自然语言处理,人机对话技术等在AI领域的基础性研究。她认为,IBM只发展这条技术中轴线是不够的,IBM跟其他的互联网公司不一样,很多互联网公司是以消费者作为最终用户,但IBM所面对的是大量的市场企业用户。对于以消费者为主导的市场,需求实际由互联网公司来决定。比如一些基于互联网的应用,消费者只是学习怎么使用它,需求由互联网公司就可以决定。像今天的谷歌、Facebook等互联网公司,考虑在AI上面进行创新的时候,主要考虑的是要推给消费者的应用需要具备哪些AI能力更能吸引个人用户。反之,对于企业为主导的市场,需求往往是由企业来决定。这就意味着IBM面对的大量需求都是由客户决定,因此,对于IBM的挑战是如何把AI中轴线的技术用到不同的企业里,满足各类行业客户的需要。
那么,IBM围绕那条中轴线在做大量AI研发的时候,是如何把AI用到不同的行业里去弥补技术的不足?如何更好地结合产业链上下游?
林咏华表示,如交通、医疗、智能制造、汽车行业等,其实要把AI的能力用到各行各业,中间有大量的技术创新需要弥补。所以,这催生了我们在AI技术中轴线以上的第二条技术发展轴线——行业支撑技术线。这条轴线起到了把上游的行业应用和中游的AI平台、算法等技术进行对接的能力。此外,在一个行业领域中,还需要慎重考虑AI技术如何经济性地去落地。在今天,有许多新型的AI计算,例如针对视频分析的深度学习,耗费大量计算能力。哪怕使用现有最好的GPU芯片,往往需要在每个摄像头的成本之上叠加超过10倍的计算硬件成本。这对一个新技术的落地就会产生很大的阻力。因此,IBM以及其他公司,都正在做大量的芯片研究。这也反映了我们在三条发展轴线中的最后一条,就是处在AI技术中轴线之下的AI硬件基础研究。IBM从2014年就发布的神经元芯片,目前正在研究的量子计算技术,内存计算技术,以及针对深度计算的整个硬件系统的创新,都是在这条轴线上。
谈到与产业链上下游的结合,她认为,产业链包括:下游的硬件厂商,中游的软件厂商以及上游的企业应用。目前,如果对于精度、复杂性、系统性要求不高的话,产业链上、中、下游可以通过松耦合完成融合,比较容易。但如果追求高性能、高精度,就需要产业链的深度融合,包括对中游的软件进行定向的优化和改造,对下游的硬件进行定制化的开发,这样才能够满足上游行业应用的高质量需求。
看点
02
被争抢的AI风口,其他企业能否享受AI红利?
随着人工智能热度的攀升,各企业趋之若鹜,希望能够借此机会弯道超车的企业,是否具备足够理性的认识?在AI领域技术基础较薄弱的企业,又如何才能享受到AI带来的红利?
对此,林咏华表示,企业想进入AI领域,会希望在自己的业务领域能获得新的增长点,希望借用AI的力量打造出新的产品赢得更多市场份额,希望通过AI把已有的产品提升一个水平,从而更快地击败市场上的竞争对手。所以,对于这些希望利用AI技术的企业而言,有两点非常重要。
第一,找准AI技术在自身业务领域的定位,也就是对未来产品的战略思考。这一点是无论如何不能由别的公司代替企业去思考,因为只有企业自己最了解自身的业务领域、发展机遇和企业现状。
第二,Time-toMarket,时间是十分宝贵的。在目前信息平坦的年代,市场机遇的赛跑就是时间的赛跑。
因此,想要借助人工智能为自身带来红利的企业,需要重点思考和策划上面两个问题。除此之外,林咏华还表示,今天,在与时间赛跑的过程中,企业面临的最大挑战是人才和数据的问题。
如何“借助外力”往往让很多企业犹豫。如果像传统的购买企业服务模式来解决人才问题,对于一些行业或许行不通。而许多行业,他们的数据具有高度保密性,不能把这些数据都交由第三方公司进行数据训练和分析。此外,企业的生产环境所针对的数据类型也会随着时间有所改变。因此,哪怕企业交由第三方公司开发了一个机器学习的模型,是否之后所有在生产环境中的变化都要依赖第三方公司进行调整呢?所以,在引入AI技术的过程中,企业往往会在“人才培养时间过长”和“把控产品”之间犹豫。
基于此,IBM在为企业市场打造的AI平台中引入了“AIforAI”的概念。为企业打造的AI开发平台不仅仅是一套工具或方法论,而是真正把一个“AI大脑”潜入到AI开发平台。IBM在“AI大脑”中率先引入了多种深度学习技术,如迁移学习、自动化机器学习、数据增强等。一方面把IBM研究院多年的机器学习研究成果内嵌到系统中,让AI开发平台更像一个专家系统;另一方面,通过“AIforAI”技术,让这样的平台可以针对企业自己的数据进行自动化学习和优化。通过这些技术的内嵌,企业开发团队在没有深度学习的技术背景下,也能很容易地获得好的机器学习准确率。
关于数据的问题,林咏华认为,过去几年,深度学习的成功是基于海量的互联网开源数据。但这些数据都是互联网的数据,和企业希望解决的问题(如特定病种的医疗影像、产品质量的影像等等)没有直接关系。所以,当需要使用AI技术来赋能自己的业务领域时,企业需要自己准备业务场景的数据集,也需要由具备专业领域知识的人员来标注数据集。因此,准备数据这个过程本身就极耗时间和人力。另外,企业往往会面临数据不足的问题,尤其是需要高度关注的数据类型。例如,在医疗影像中,往往有着各种症状的数据比健康人群的数据更为重要;在生产制造中,有着各种瑕疵问题的数据比质量正常的产品数据更需要关注;在汽车驾驶中,各种恶劣天气路况下的数据比正常天气和光照的时候获得的数据更需要注意。但这些数据往往是小概率情况下的数据。不解决好这个问题,就难以把AI真正用到工业场景中。
对此,IBM研究院专门确立了一系列针对小数据(SmallDataset)的研究,基于迁移学习、数据增强等课题进行深入研发。这些技术也应用到了IBMWatson及企业AI开发平台(PowerAI)上,可以直接帮助企业解决数据的问题。
看点
03
高校教育应把深度学习作为一门必修课
人才是推动人工智能发展的关键因素,上至国家政府,下至科技企业,AI人才不足成为影响当前行业发展的主要瓶颈。在AI人才队伍建设方面,国家和企业从人才培养体系上也在不断变革。
但是,什么样的AI人才才是真正行业所需?未来的AI人才不仅应具备深度思考与分解问题的能力,具备能够和机器进行对话的能力,还应该能够将自身AI技术与业务很好的融合到一起。
谈到如何培养出将AI技术与业务很好地结合的AI人才,林咏华说:“培养这样的人才主要从两个方面来考虑。一方面,企业通过招聘和自我团队建设,积累自己的AI人才。这些人才在熟知业务的同时,经过企业AI技术培训和实践,争取将技术与业务更好的结合。另一方面,AI之所以最近几年发展这么迅猛,是因为有了深度学习,自2012年之后,深度学习就成为了AI领域的基本技术。从现有教育来看,在高校教育里的很多学科领域(例如能源、电气、医疗、经济等学科),希望能把深度学习作为一门必修的基础科目。这样,当这批人才进入岗位,自然懂得深度学习怎么去用,并能够把高校教育经历与自己的业务很好结合。”
大数据周刊
电话:010-57524293
众论大数据 引领大时代
长按二维码关注