面临大考,真正规模化的实时 AI 出现了吗?

原文发布于IBM中国微信公众号,本人为原文作者

面临大考,真正规模化的实时 AI 出现了吗?

从无处不在的刷脸到无处可躲的推荐,从无人驾驶到无接触配送,人工智能技术正在从各个角度改变我们的生活,一时间似乎“无所不能“。但面临现实的大考,我们却发现很多问题,仅靠人工智能却无力解决。AI的大规模应用,虚拟与现实的无缝对接,看来仍需时日。

人工智能技术在过去几十年里经历了多次高潮与低谷,尽管并不完美,但各大科技公司、数代科学家、工程师一直在不断努力,攻坚重大技术突破,将人工智能的应用推向一个个新的高度。IBM正是其中一员。

北京时间2022年4月6日,IBM发布了新一代主机z16。这一次IBM带来的是实时的企业级人工智能。历时数年,IBM z16在人工智能方面修成了四大“独门武功”,助客户将AI赋能于其部署在IBM主机上的关键业务系统中。有z16助力,企业可以放心将实时预测能力植入企业关键业务而不必担心其造成交易延时或者安全隐患,从而提升决策速度,提供更好的用户体验,创造更多的用户价值。今天,我们就来聊一聊z16这四大“独门武功”。

小李飞刀:Telum处理器

天下武功,无坚不破,唯快不破

IBM z16采用了7纳米技术的Telum处理器。该处理器为AI实时推理加速而设计。Telum处理器配置了8核16线程,频率达到5.2GHz。每个处理器核都有其独占的32MB二级缓存,256MB虚拟三级缓存和高达2GB的四级缓存。Telum处理器还配有片内集成(on-chip)的AI推理加速器,可以大幅提升深度学习模型的推理运算的效率。有了AI推理加速器的加持,客户可以放心将AI能力植入其运行在IBM 主机上的核心交易系统,享有IBM 主机独一无二的高性能,高安全性和高可用性,也不必担心AI推理对大规模并发交易带来的响应延迟。

面临大考,真正规模化的实时 AI 出现了吗?_第1张图片

九阳神功:IBM主机机器学习平台

九阳神功讲究融会贯通,练成后天下武学附拾可用,将之发挥至极致。

IBM Watson Machine Learning for z/OS是运行于z/OS 的端到端的机器学习平台,支持客户从模型的开发、部署到监控、持续自学习的全方位管理。WMLz采用了IBM研究院研发的深度学习编译(DLC, Deep Learning Compiler)技术,对深度学习互操作框架ONNX(Open Neural Network Exchange)在IBM Z上推理执行进行优化,充分发挥Telum AI 推理加速器的强大威力。IBM主机学习平台配合Telum处理可以支持每秒数十万次的交易吞吐量。除了出色的性能表现,WMLz也为主机上的应用提供了丰富的应用程序接口。CICS、IMS、Liberty等各种传统主机应用都可以仅用十几行代码的改动即将AI推理能力嵌入其中。对于想尽快了解IBM Z对深度学习模型推理支持的客户,WMLz还提供了免费的社区版本OSCE (Online Scoring Community Edition)。该社区版本基于z/OS Container Extensions(zCX)技术。在zCX之上,客户可以在1个小时内即完成产品的安装和配置。

独孤九剑:新一代智能数据库Db2

独孤九剑讲究料敌机先、后发先至

正如与IBM z16同时发布的还有IBM主机数据库Db2的新版本Db2 13 for z/OS——不仅能知道用户有什么,更能猜到用户要什么。Db2 13 for z/OS的一大特性是SQL Data Insights(SQL DI)。SQL Data Insights内嵌深度学习模型。这一模型同样出自IBM Watson研究院。该模型可以帮助用户从Db2的关系型数据提取语义信息,更好的理解其数据之间的关系,进而发掘出数据的业务价值。例如,在SQL Data Insights的帮助下,客户可以从一些欺诈交易找到更多与其相似的交易进行审查,或者从已知的欺诈交易中发现欺诈的“模式” 来改进欺诈交易的侦测,包括利用这些“模式”对新发生的交易是否为欺诈交易进行预测。与其他AI解决方案不同,这些功能都可以通过数据工程师和应用开发者所熟悉的SQL来完成而无需专业的数据科学家的介入,从而可以使项目的部署时间从几个月缩短到几周甚至几天。此外,该数据库特性也针对Telum处理器做了优化。配合Telum处理器,Db2能够更快的将数据变成信息,转化为业务价值。

北斗七星阵:开放的生态系统

不仅仅是单打独斗,更有北斗七星阵中各人兼具数人能力,威不可挡

新一代IBM 主机更加开放。能够利用Telum强大处理能力的不仅仅是IBM软件,客户和第三方同样可以利用随z/OS发布的深度神经网络库zDNN加速自己的深度学习模型。IBM也积极和开源社区展开合作,很多常用的机器学习框架也增加了对Telum的优化支持,例如TensorFlow和Snap ML。客户可以在zCX、Linux on Z或者Linux One上使用这些从社区获取的软件构建自己的解决方案。

面临大考,真正规模化的实时 AI 出现了吗?_第2张图片

光说不练假把式,无“应用”不AI

以每时每刻都在发生的信用卡交易为例:金融机构由于担心交易延迟和数据安全性,影响其收入和消费体验,一直以来,并不可能大规模实时运行深度学习模型,只在不到10%的大批量交易中运行欺诈检测模型,也就是说还有大量的欺诈没被检测到。

利用Db2 13 for z/OS的SQL Data Insights,客户可以通过对欺诈交易的模式进行分析。进而更有效率在主机生态系统上利用机器学习框架构建深度学习模型,并将深度学习模型部署到集成在主机应用中的WMLz中。最后,IBM z16的Telum 处理器让这些金融机构有史以来第一次可以进行大规模的实时欺诈监测。IBM z16 以1毫秒的延迟每天可以处理 3000 亿个深度学习模型的推理请求。 对消费者而言,这意味着可以减少处理信用卡欺诈交易所耗费的时间与精力;对金融机构而言,则意味着可以减少收入损失和更好的客户体验。

IBM z16不仅仅在反欺诈领域可以大展身手,更为客户创造新的业务模式提供了可能。北美某银行客户利用主机机器学习平台自动处理贷款申请,在降低贷款风险的同时将贷款申请处理时间从几小时降低到几分钟。欧洲某政府部门利用IBM主机在卫星图片中及时发现房屋结构变更,保证信息和税收的实时性,提升政府工作效率。

如果把现实世界比作“江湖”,那各路“武功”的最高目的,莫不是为了国泰民安。无论是解决肉眼可见的现实困难,还是在幕后默默的保护我们周全,机器能够如人所愿、为人所用的那一天,我们期待能够尽早到来。

如有兴趣,IBM还有强大的实验室专家服务团队帮你实现你的AI蓝图,实时洞见未来。

你可能感兴趣的:(人工智能)