移动、数据库、云计算、大数据、VR/AR、人工智能、区块链……小编从业以来技术圈的技术潮流更新就没有停止过。对于开发者来说,如果选对了未来技术方向,那必将事半功倍。现在,最火的技术非人工智能莫属了,大家怎么进入到AI行业,是从数学模型开始学起自己研发,还是选用已有平台直接应用?相信后者的实现难度将有几何数级的降低。
本文带给大家的主要内容如下:
说到AI开放平台,或者说是开放AI技术能力的PaaS平台,市面已经有了不少,如:谷歌、微软、英特尔、百度、腾讯、科大讯飞、小米……今天,我们说的AI技术平台是京东,一起看看它们有何不同之处。
提到京东的AI,大家第一反应可能是无人机、无人仓、无人车,前不久,基于京东大数据有了一些新的应用——PinoAI平台,CSDN记者与京东集团副总裁颜伟鹏和PinoAI项目技术负责人包勇军,就PinoAI的应用背景和案例进行了探讨和了解。
小贴士:PinoAI是什么?
PinoAI是一个综合型大规模分布式人工智能平台,以统一框架的思路,用于广告各类复杂场景的训练和预估,由其支撑的广告业务占比已达70%。该平台负责了机器学习从数据源头到线上服务的全过程。它目前包含有模型数据系统、训练系统、评估系统、预测系统。
“AI是京东未来12年的核心战略”,京东集团副总裁颜伟鹏说。
据了解,人工智能对行业的影响方方面面,应用非常广泛。在国内电商行业,京东的AI应用场景非常的丰富,从客户下单流程的推介算法、交互、人脸识别、语音识别的搜索,都很好的用到了AI技术;在供应链管理,实现自动补货、自动定价,帮助商家更好的服务到消费者;在仓储物流方面,无人仓、无人机、无人车业界领先;在市场营销方面,通过数据和营销能力的打通,大大提升了其广告平台效果。总的来说,京东在AI领域的应用非常广泛。
京东打造PinoAI平台最初的目的,是为了方便内部的AI研发。如果工程师想去开发一个AI模型,只需要聚焦在他关注的领域把数据上传下来。Pino通过很多现成的AI算法,可以很快的把模型训练出来。模型可以进行测试,并支持超大规模的在线服务,它可以很容易整合到现有的产品里面,起到减少研发投入、加快研发速度的作用。
PinoAI平台在京东内部得到非常广泛的应用,目前大概有六七十个AI的应用基于该平台打造,能够支持超大规模的应用,百亿级的数据更新,毫秒级的反馈时间,几十亿的维度,这些应用在京东已经稳定的服务了一两年。
如今,京东希望能够把PinoAI平台开放出来给各行各业去用,希望帮助社会通过大数据提升他们商业效能的能力。PinoAI里面包含很多应用场景,企业可以直接使用,无需考虑大规模集群部署,应用的维护和管理等传统问题。这里也列了一些,我们目前还是非常丰富的。
广告、推荐业务不同于传统的人工智能项目,它不仅需要对复杂问题建模和高效训练,而且需要在很短的时间内对每一次广告、推荐请求作出毫秒级预估服务。它在一步步演进的过程中,通过自身弹性缩放能力,应对了像618大型电商活动的高并发、大吞吐场景:2015年618,PinoAI1.0项目为应对流量增长 、复杂模型、实时服务的挑战而出现,它支持的广告业务已超过30%,应对了10.3万QPS。2016年618,PinoAI将宽深网络引入到推荐场景的模型中,随后实现了模型参数从千万级别到数十亿级提升,且支持了百亿级样本数据,至此由它驱动的广告业务占比已达到70%,同时成功应对了20.4万QPS的在线请求。2017年,PinoAI2.0在大规模分布式的道路上更进一步,在计算性能上较1.0获得了近6倍的进步,在模型类型和模型应用场景上也迎来了它的爆发期,618大促期间它面临了苛刻的考验,经受0点非线性峰值增长的压力,借助公司强大的基础设施,通过弹性扩展,成功应对高达50万QPS的流量洪峰。
AI支持的广告业务占比
大型促销活动的玩法越来越多,AI相关的业务场景已经不仅仅局限于广告、推荐业务。PinoAI支持着各类复杂场景的通用算法平台,它覆盖了京东广告的各个业务线,并且推广应用到金融风控、人机对话、新零售、智能物流、图像识别等业务场景上。
“宝洁通过京东大数据的人群分析,通过海飞丝购买人群得到了大量新客户。宝洁对数据分析效果很满意,广告投放增长了2.5-5倍。我们还跟一些大的品牌商在合作,使用Pino在提升他们的效能。”颜伟鹏说。
现在PinoAI2.0支持跨集群、异构分布式训练,百T级数据小时级处理,数十万并发的在线请求毫秒级响应。Pino作为整个京东的开放平台的一部分,京东希望利用其丰富的应用场景、大数据、品牌商上传的数据,与客户一起打造新的应用产品。京东通过开放AI等基础服务和能力,企业可以更好的利用AI解决内部的问题。
最后,就CSDN记者关心的几个问题,颜伟鹏和包勇军进行的解释:
CSDN:平台是否需要很高的代码需求?
京东:PinoAI有两个界面,一个界面不需要编写代码的,只要把数据放上去就会出来一个模型,就能够用来做预测,这个界面主要针对分析师和管理者。这些人代码能力不强,但是商业分析能力很强,我们希望把这些人群吸引过来做数据分析。另外一个界面需要编写代码,主要针对高级开发者,他们需要通过开发的手段来完成一些更加深度的AI能力。
试用该平台入口请点击
CSDN:平台提供的数据是否规范?
京东:我们的数据肯定是干净、清晰、可用的,企业提供的数据需要自己来清洗,如果其数据质量不好,京东会帮助它并提供定制化服务。
CSDN:平台场景是不是已经变成模块化的场景,大家直接拿来就能用?
京东:有一些模块化的语音、销量预测的服务可以提供,最终目的还是希望开放出来让更多外界的科学家来使用。
CSDN:模型是京东自己研发的吗?
京东:有一些代码是我们研发的,我们的目的并不是所有的都要我们研发,我们是把所有的模型放在一起供大家使用。
这么多家人工智能平台其实各有千秋,每家平台都依托于其原有的产品和技术优势来吸引消费者。有的是计算,有的是模型,有的是应用场景。京东AI给笔者最大的感触是电商属性强烈。在电商领域,各家电商的技术部门,已经不仅仅只为客户提供优质的体验和服务,更是为其产品背后的厂商提供着数据分析、广告预测等新型服务。而作为技术人员,我们将更容易将注意力转向自身业务,人工智能的事情,不妨交给这些不同属性的厂商们来做。
技术人员难得清闲会儿,何乐不为啊!!!