AI关键技术预测及其在I&O团队建设与DevOps系统中的运用(上篇)

引言


近年来,AI(人工智能)领域一直备受关注,它早已不再是科幻小说和电影里虚构出的弗兰肯斯坦,而是以润物细无声的姿态,深入到我们生活的方方面面。

 

在零售、物流、教育、医疗保健等多个领域,AI都在发挥越来越大的作用,AI领域的新科技被看作是新的技术发展和商业发展引擎。

 

中国是世界上AI科技发展最快的国家之一,自2018年以来,企业中的人工智能采用率增加了近三倍。有调查发现,中国AI发展的三大动力是:降低成本、提高效率和提升客户体验。

 

虽然对AI科技抱有巨大热情,中国市场仍然有无序增长的问题,无论是已有技术解决方案的供应商,还是声称提供创新服务的初创企业,都是如此。在这种情况下,对总体发展趋势和核心技术发展的梳理就更为迫切和重要。

 

因此,苏宁零售技术研究院预测从目前到2023年的五年内AI关键技术的发展,以及AI关键技术在I&O团队建设与DevOps系统中的运用,供企业CIO、CTO、COO、AI工程师以及所有对AI感兴趣的人士参考。

 

我们的考察分为四个部分:

 

1,AI总体发展趋势预测。

2,ML(机器学习)和DL(深度学习)。

3,I&O(IT&Operations,即基础架构和运营)团队建设。

4,DevOps(Development和Operations的组合)开发平台建设。

 

第一部分 AI总体发展趋势预测

 

从目前到2023年的五年间,AI将会持续迅速发展,但各个领域的发展是不均衡的。苏宁零售技术研究院对发展的总体预测如下:

 

1,到2021年,由于增加了对跨云计算和边缘计算环境的部署,由推理和训练加速器组成的全球AI处理器收入将增长3倍。

 

2,到2021年,AI的应用场景将推动数据存储的指数增长,需要新的体系结构和数据管理技术。

 

3,到2021年,跨交付模型(云计算、数据中心和边缘计算)部署AI工程解决方案将促进新的推理和再训练生态系统。

 

4,到2022年,利用AI技术(如ML和DL)并涉及边缘计算或物联网的应用场景只有15%会成功。

 

5,到2023年,AI使用的计算资源将比2018年增加5倍,AI将成为推动基础设施决策的首要因素。

 

6,到2023年,70%的AI工作使用容器或使用需要DevOps的无服务器编程模型进行。

 

7,到2023年,40%的I&O团队将在大型企业中使用AI增强自动化,从而提高IT生产率、灵活性和可扩展性。

 

以上的研究表明,AI的发展会有自己的步伐,同时会经受市场的充分洗礼。苏宁零售技术研究院通过分析AI发展趋势,得出了以下五个看法:

 

1,AI的早期成功是由战略驱动新技术和算法的应用,提供有效的API(Application Programming Interface,应用程序编程接口)、工具,创造新的机会。

 

2,生态系统的快速成熟使早期采用AI的企业能够广泛应用人工智能,以推动跨业务线和IT组织的生产力和自动化。虽然成功的潜力巨大,但I&O领导者应尽早为AI制定计划,因为实现这些计划需要大量时间和精力。此外,这些策略必须使用灵活的技术来提高成功率。

 

3,以往的成功将提高企业对AI能力的期望值,导致对技术过于乐观的计划,造成项目超支,这一点需要注意。

 

4,利用AI寻求竞争优势的企业正在评估多维ML和DL模型,以提高AI项目的准确性和商业价值影响。

 

5, AI计划中的大多数都会失败,但当计划成功时,将有可能提供革命性的用户体验。

 

从以上五点我们可以得出,AI计划的成功同时需要乐观、谨慎和选对领域。所以,对于负责基础设施战略的领导者,研究院建议:

 

1,根据业务需求调整基础设施策略,以确保AI计划能够成功。

 

2,将开发、购买和外包的策略,与成熟的工具和预先集成的解决方案相结合,最大限度地减少AI项目占用的时间和成本。

 

3,雇佣AI方面的专家或重新培训现有团队,以获得新技术的开发能力,运用新工具,制定和执行灵活而迅速的战略。

 

而对于总体的战略规划,研究院给出的策略是:

 

1,通过与数据科学团队或业务线实施者密切合作,了解每个AI项目的核心运营和增长动态,改进AI的基础设施规划策略。

 

2,通过利用基于云计算的AI资源[包括 API(应用程序编程接口)、PaaS( 平台即服务)、SaaS (软件即服务)和IaaS (基础设施即服务)]来原型化和验证AI计划,从而提高生产力。在某些情况下,根据云服务提供商的不同能力和技能水平,可能需要多云策略。

 

3,针对跨场景应用中涉及的创新计算、存储或网络设施,进行标准化,从而将风险降到最低。应选择支持最广泛的ML框架和应用场景的加速器和基础架构技术。

 

IT团队领导人可能既需要负责基础设施战略,也需要进行总体的战略规划,因此,研究院建议,IT团队领导人要考虑三个关键的影响因素:

 

1,支持新的和多样性的边缘计算环境,以部署经过训练的ML模型。由于使用场景复杂多变,管理也会变得复杂,设备的增长特征曲线可能类似S形。

 

2,为持续的训练提供计算资源。一些数据特性频繁变化的应用场景,可能需要不断重新训练模型(例如,使用ML进行供应链库存优化)。这就意味着,无论是在本地还是在云中,都要提供越来越多的正确类型的计算实例(例如,使用DL进行图像处理)。

 

3,制定面向增长的数据管理策略。边缘设备收集的新数据在许多情况下需要重新整合到核心数据库中存储,新增数据需要重新整理和规范化以便于模型训练中使用。因此产生的数据增长较为复杂,特征曲线可能类似S形。例如,在像自动驾驶这样的使用场景中,根据操作参数,每天的数据增长率可以达到10兆字节。


第二部分 ML和DL技术发展

 

从自动驾驶车辆到医疗应用,ML和DL都至关重要。研究院预测,到2022年,超过75%的企业将用 DL 取代以往使用传统ML的场景。

 

然而,到2022年,利用AI技术(如ML和DL)并涉及边缘计算和物联网的场景只有15%会成功。由于技术的复杂性和前沿性,失败比例很高,但会积累大量宝贵的数据和经验。

 

那么,ML和DL在各个具体使用场景中都具有什么样的特征呢?苏宁零售技术研究院的主要发现是:

 

1,当在边缘计算和物联网环境中利用AI技术(如ML和DL)时,最主要的技术挑战之一是特定场景相关的数据分析技术的复杂性。


2,除了少数一些行业(如汽车行业),嵌入式应用仍然缺乏业务线,在人力资源建设、技术交流活动中应该予以重视,促进与IT部门之间的更广泛的合作。

 

3,尽管早期在边缘设备的数据挖掘方面取得了成功,但曾经最有前景的以客户为中心的应用场景已经减少,ML 和DL在资产管理和资源规划中获得更多应用。

 

由于AI领域激烈的创新竞争压力,许多企业正在寻找应用DL技术的场景,却不够了解当前技术的局限性以及适合的应用切入点。

 

4,DL擅长于认知领域,如图像识别、机器翻译和自然语言处理,其中输入的原始数据量很高,每个变量本身几乎没有实际意义(例如,图像中的像素或文本中的字母)。

 

5,经典的ML技术需要的数据和计算资源更少,部署起来更简单,也更加透明和易于解释。因此在需要审计和监管的行业中,经典ML技术是更好的选择。

 

透过以上五点分析,研究院认为,DL和ML未来的市场影响颇值得探讨:

 

1,早期应用图像识别(人、物体和场景)的场景中,已经开始能够在边缘设备上部署嵌入式的复杂模型。到目前为止,大多数嵌入式模型可以成功的处理来自可识别对象一定范围内的粗粒度数据。

 

尽管图像识别很有用,但正如AI领域常发生的事情,人们对图像识别在现阶段的投资回报也过于乐观了。到目前为止,有价值的高级别定义的识别能力,大多需要在高性能的服务器上处理,而不是在普通的处理器上处理。即使基础设施相当强大,可靠的实现DL应用还是较为困难的工作。在边缘设备上,AI技术的成功将依赖于智能优化技术,目前还需要大功率支持,技术尚未成熟。

 

2,成功利用AI技术的传统使用场景始终是业务线和IT功能之间紧密协作的结果。当涉及有工程文化底蕴的行业(例如,石油和天然气、城市基建、制造业、汽车业和航空航天业)时,这种合作更加有效。在这些行业中,在边缘设备上实施人工智能技术已经产生了可见的效益。然而,在轻资产行业中,当使用场景涉及客户体验和期望时,就更具挑战性,更难产生效益,需要IT和业务功能之间更密切的协作。

 

3,炒作也随着早期边缘设备上AI应用的成功而发生。大多数团队觉得,他们的大部分使用场景将以客户为中心。事实证明,成功来自于生产操作的简化、资产管理的改进或资源规划的增强,在这些方面,边缘设备处理的“人员数据”不那么主观,更多的是客观的机器和流程数据。不过,以客户为中心的使用场景仍然吸引着有冒险精神和想象力的营销人员,获得大量的推广。

 

4,尽管以人为中心的使用场景很有吸引力,但它不可能像以工程为中心的使用场景那样快速地带来效益。除了前面提到的原因之外,在基于人的边缘设备中,隐私和安全问题将变得更加严重,很难说服客户或员工,利益为何一定大于风险。

 

5,AI继续被媒体和供应商夸大。这种炒作的基础是:基于深度神经网络的机器DL有望在图像识别、计算机视觉和自然语言处理等领域取得很大成就。

 

所以,数据科学家热衷于学习如何使用TensorFlow, Caffe, Torch, MXNet, Keras等框架构建深度学习模型,这些框架工具确实可以节省时间、提高效率,已经成为热潮。然而,数据科学家应该更加重视使用经典ML的项目,很多项目具有很高的实用价值。

 

6,许多尚未开始实践的企业和个人都希望DL能为他们带来神话般的提升,因为DL模型适用于广泛的领域,比如绘画、音乐和语言——三种最接近人类心灵的数据类型,令人印象深刻,浮想联翩。很多人希望通过参加最新的培训,抢先进入这个领域。

 

7,现实是,DL仍然是学术界、数字原生企业和初创企业的试水领域。大多数企业还没有做好深入学习的准备。大多数企业正在努力解决的业务问题,实际上并不需要很高的DL水平。

 

最重要的是,要真正理解和熟练使用DL,需要大量的时间和精力。与经典ML相比,DL模型需要大量的数据和计算处理能力。另外,虽然DL具有很高的预测能力,但在很大程度上是一个“黑箱”,难以去解释,即使研究人员现在也不能完全理解这些DL模型的“内部”。在数据科学中,人们应该寻找最简单有效的模型,增加不必要的复杂性是没有意义的。

 

8,大多数企业不应该忽视DL,但应该集中精力雇佣熟悉经典ML方法(如回归)、对统计学习有深入了解的数据科学家,而不是只擅长DL却不擅长处理数据的人。了解要解决的问题的本质,比使用TensorFlow、Caffe、Torch、 MXNet、Keras等工具更重要。

 

9,机会成本也需要考虑。数据科学家花时间精力学习DL和构建复杂的神经网络模型,也意味着一些可以被传统ML技术简单解决的业务问题,没有得到合理的资源投入。


针对ML和DL的市场影响,苏宁零售技术研究院院长王俊杰给出的建议是:

 

1,通过调查投资回报快的早期物联网应用案例,让在边缘设备上实施AI技术的收益更大。

 

2,通过企业内部工程团队的帮助来加强AI技术的落地,无论团队是来自IT部门还是来自运营部门。

 

3,在实际业务中,通过促进分析团队、业务线专业人员和领域专家之间的紧密协作,来提高AI技术的成功率。

 

4,学习不同ML算法的范围、每种算法最适合解决的问题类别,以及每种技术的优缺点。

 

5,尽量使用最简单的ML技术来解决业务问题,因为这通常需要的数据和计算资源较少,涉及的复杂性也较低。

 

6,对于认为需要DL的使用场景,首先评估现有的提供API接口或SaaS解决方案的DL供应商。


*本文为《AI关键技术预测及其在I&O团队建设与DevOps系统中的运用(上篇)》,苏宁零售技术研究院会继续推送下篇,敬请期待。

你可能感兴趣的:(AI关键技术预测及其在I&O团队建设与DevOps系统中的运用(上篇))