2016年,百度开始把积累多年的人工智能技术全面对外开放,从底端智能云,中间百度大脑,到顶层的DuerOS,百度打造整体人工智能开放生态,旨在帮助企业、业界能够更快速的使用、应用人工智能的技术去发展,为人类带来更好的生活。
在此背景下,为了更加全面的了解百度AI开放平台及AI生态,将由百度AI技术生态部产品负责人刘倩为大家介绍百度在人工智能开放平台与开放生态方面的思考、进展以及沉淀。
以下为刘倩老师演讲实录
百度AI开放生态战略的中流砥柱---百度大脑
百度AI开放生态是从底端智能云,中间百度大脑,到顶层的DuerOS,打造的整体人工智能开放生态,今天主要介绍百度大脑。
图1:百度大脑技术布局
百度大脑覆盖了从数据、算法、计算到感知层、认知层、平台层、生态层、应用层的不同能力层面的技术布局,其中平台层对外开放,生态层对接合作伙伴、开发者,最后在应用层落地企业、行业应用。
在过去的半年时间内,百度不管是从语音、视觉还是自然语言处理技术、应用都得到了非常快速的增长。百度大脑每天调用次数超过四亿次,尤其是在中间的视觉技术方面,日调用量增长超过400%。视觉正处在从开始到广泛应用的阶段,预测在未来一到两年,视觉方面的应用和应用场景会进一步大规模的爆发。
同时,语音技术有着非常普遍的应用。尤其在生活的周边,比如手机百度的语音搜索功能,小说里面朗读阅读小说的功能等。
各地开发者将AI能力应用在各行各业
百度AI平台上的开发者遍布了全国各个区域,尤其是在北上广深以及东南沿海的城市,代表了百度AI在高新技术城市和经济发达区域的追求与探索。在海外的如美国、肯尼亚等,每天也在被各种各样的其他国家的开发者所使用,比如最近我们的人脸识别被用到了肯尼亚、非洲。同样,百度AI被广泛的应用在文化娱乐、企业服务、教育培训、金融等各个行业当中,超过20多个行业都在使用百度AI技术。如企业服务,作为一个非常基础的人工考勤或门禁的功能,在百度应用非常广泛,包括百度大楼的进楼通行都有人脸的闸机、食堂、咖啡厅、面包店都可以用人脸进行支付。还有很多提高效率的场景,比如用文字识别去自动录入一些票据,使得报销、财务的工作量大幅度减少。再比如被广泛应用的呼叫中心场景,人工智能可以自动检查客服和客户对话过程中语言是否恰当,或者智能外呼,机器和客户做比较固定的对话流程,这些都可以大幅度减少企业管理和运营的成本。在智能硬件方面,不管是智能家居、家电还是小朋友用的故事机、早教机,现在AI已经成为必备的功能。同样在零售方面,会员管理、客流量的统计、自主结算等,也有着非常广泛的应用。
百度大脑最新架构---AI开放平台3.0
图2:百度AI开放3.0
行业应用的背后是百度AI开放平台系统的全面输出,图2是开放平台的最新架构,最底层是微芯片层。第二层是百度自研的深度学习框架PaddlePaddle,第三层是定制化的平台与工具,零算法基础的定制化训练平台。第四层是场景化的能力,这是百度训练、优化打磨出来的即查即用的能力。另一方面,随着端的计算能力和云需求越来越扩大,我们在开发方式方面提供云和端两种开放的方式---云端结合。最右侧的AI市场是为开发者和合作伙伴、企业搭建的上下游产品服务交易平台,希望能够让他们的能力更好的被工业、企业界认识,并大规模的应用在行业中。
120多项场景化能力与解决方案,帮助各行业快速实现AI升级
百度AI开放平台一站式获取各类能力,提供了120多项细分的场景化能力和解决方案,包括从语音、人脸识别、文字识别、细密度的图像识别、垂直的图像识别以及视频的自然语言、处理的知识图谱等一系列的能力,这些能力可以直接在产品和应用当中使用,能力集成速度最快仅需5分钟。
多项能力永久免费,全面普惠开发者
80%以上中小企业和开发者不需要花钱使用百度开放的能力,比如语音识别,每天有5万次的免费调用次数,语音合成每天有20万次的免费使调用次数,而且还可以去申请更高调用次数,只要我们能合理的描述清楚应用场景即可,经审批后,即获得更多的免费资源。语义、人脸、图像等方向的技术接口都有免费使用的次数,这是百度希望大家能更好的体验和应用做的努力。
定制训练平台,快速转化企业定制化需求
现实中,依然还有很多企业没有办法通过这120个通用能力应对现实中应用场景的需求,比如我们曾经收到的中小企业反馈,能否增加一个识别鞋底花纹的功能。因为这是一个专门做鞋底的企业,可以生产几千种鞋底,但是当客户拿着一款鞋底来找他说你能不能生产这种的时候,他只能人肉在图片库里看一遍。还有客户询问能否提供可以检索路面上哪里有坑、哪里有洞的功能,这些都不是目前业界包括百度在内的可以提供的功能,那这些问题怎么办?所以我们把百度的能力做成一个零算法基础的定制化的平台EasyDL,可以帮助我们的开发者和企业自己去上传数据,自己去训练,自己去获得自己的业务模型的平台,并且是不需要去了解背后的算法,深度学习这些原理。
EasyDL平台推出后受到企业的热烈欢迎,并且实现了很多个性化的需求模型。比如在开发者大会上介绍的一个西藏医生用它训练了显微镜下识别寄生虫卵的模型,还有用它做鞋底花纹、动物识别等等,不同品类不同类型的应用能力在这个平台上得到了最大程度的发挥。在定制化平台,百度提供从低端到顶端不同的开放策略。没有网络或者计算能力相对不够的情况下,可以直接在端上把计算完成。如云端运行需要更大资源的运算、端上开放SDK,以及云服务开放平台。如果传统的摄象头不具备人脸识别的能力,我们也开放把人脸检测出来的算法,帮助摄像头厂商升级,把他们的摄象头变成人脸识别、图像识别、鞋底花纹识别的摄象头等等。因此我们在不同的层面开放不同的软件平台和硬件,希望有更多的开发者能够利用现在端设备计算能力快速扩大的趋势,去享受这个过程,也能为产品、业务带来更好的体验。
AI开放平台最底层是PaddlePaddle,既然有了定制化训练平台,那为什么还有PaddlePaddle,什么情况下用PaddlePaddle,这是我们每天都在被问的问题。首先,定制化训练平台也有一些场景不能被很好的解决,比如多分类的场景。如果我要识别三个、五个分类可能效果比较好,但要识别上千上万个,就没有办法用定制化平台做到非常好的效果,所以需要我们去不断的优化和调整算法模型。还有一种场景是当我们的对象或者目标的检测物体非常非常小,比如工学仪器上面气泡的瑕疵,喷油嘴里面的检测等等,这些是目前EasyDL平台可以解决的,也就是说技术永远是有边界的,但PaddlePaddle可以让在座的有深度学习背景的同学们,有精力、有时间去研究、探索和解决更困难的问题,创造更多的价值。
百度大脑技术的实际应用
百度大脑的技术具体应用在哪些方面呢?工业生产线中做键盘组装的企业,用EasyDL检测键盘按钮是否装错或漏装,用了三千张图片,准确率达到99%以上的模型,为单生产线每年节省12万人力成本,恰恰是机器所擅长的事情。还有一位开发者,以前是个公司的实习生,他了解百度AI开放平台以及能力以后,提出了无人职守的政务机的想法。它的初衷是提升政府办事效率,简化、透明、规范办事流程。打造这样一个无人政务机,把百度语音识别,以及语义理解的技术都加了进去,让它能智能去服务百姓。这个产品,在今年的6、7月份在贵阳的数博会上进行展出,也受到非常多的关注和欢迎。这个实习生在过去两年也已经跃升为公司的产品总监。保持对人工智能技术的创新应用好奇心,了解与探索,就可以做出来更多更好的产品,有更好的体验。
图3:哈根达斯智能售货机
还有一个例子是新鲜部落用语音识别和人脸识别为哈根达斯做智能售货机,六个月之后出现图3右边的自动售货机。可能对于互联网应用来讲,最快能达到5分钟,六个月就非常长了。但是硬件场景当中,远远不是这么简单。六个月收购一家国外生产线,不到一个月的时间做软硬件的选型和集成,最终达到了这样的产品,现在全国已经进行了投放和推广使用。
百度AI市场,为AI产业链提供快速对接平台
我们做AI市场的初衷源于客户合作伙伴经常咨询我们如何挑选效果更好的产品等诸如此类的问题,为了让客户更好的选择,我们把产品标准和评测放在AI市场上,这样客户可以快速找到合适自己的产品,不用把时间浪费在技术选型上。一方面可以把合作伙伴的能力开放出来,另一方面也把百度经过认证和评测的产品能够更好的呈现出来,让用户获得更好的使用体验。开发者们利用PaddlePaddle、定制化平台等开发各种类型的模型和能力,开放到AI市场中,产生新的能力和新的应用,一起为客户提供源源不断的创新动力。
AI生态合作联盟,共建共赢
AI的浪潮已经在越来越广泛的影响我们的社会和生活,如何能够帮到更多的企业、更多的人,是我们每天思考的问题。但AI落地是一个复杂的系统工程,我们深深感受到只有平台化、生态化才能让AI实现最广泛的落地,也只有平台化、生态化的途径才能让整个产业链的参与者共赢。换句话说,我们希望通过赋能,让更好的合作伙伴去服务更多的客户。
图4:合作联盟
以人脸识别为例,我们和硬件设备的制造商,比如人脸闸机、一体机、智能售货机等,往上有系统方案集成商和他们一起服务的最终客户。可以看到中间有很多公司不是那么知名,但是因为跟百度的合作,给他们提供了最领先、最全面的技术后,他们是有能力,有渠道给上层高端客户、头部客户提供服务,我们希望用这样的方式去更好更大规模的为企业提供服务。
在这个背景下,我们发布了燎原计划,面向全社会去招募四大类的发展对象,包括解决方案商、硬件设备商、教育培训类、数据服务类企业,提供从技术支持、品牌共建、市场拓展等全面的发展权益。目前为止,一共有200多家企业通过了我们的认证,加入到了我们的燎原计划里面,覆盖超过20个行业,并且其中有45家进入AI加速器企业。AI加速器是另外一个生态扶持计划,加速器面向B轮之前的初创企业,入选加速器的项目可以获得系统的专家课程、管理课程,如果里面有优秀的高潜力的合作伙伴,我们也会投资。
在人工智能教育培训方面,我们希望能帮助每一个对AI有热情的人成功,所以我们搭建了一系列的平台去支持愿景,包括学习平台、实训平台和社区。这两年,社区涌现出一批非常热心的开发者,帮我们为其他的开发者回答了超过50万个问题。百度搭建的这一系列平台,除了希望能帮助开发者成长和成功以外,更想把大家的聪明才智辐射更多群体,为更多人的成长作出贡献。同时,我们也将正式发布百度深度学习布道师计划,并为第一批为深度学习技术普及和发展做出贡献的人士颁奖,我们希望有更多热心传播深度学习技术、系统掌握深度学习知识的专家加入我们,一起热心、专业的与开发者提供零距离的服务与培训,共同推动中国深度学习技术的普及和发展。
百度开放所有的人工智能的能力、平台和工具,背后都有一个愿景,就是让每一位开发者都能平等、便捷地获取AI能力,这同时也是我们的承诺。我们也非常感谢各位合作伙伴、各位开发者在过去的时间里,使用百度AI能力让生活更便捷、让企业管理更高效、让学习更有趣、让人类更健康、更环保等各个方面所做出的实践和贡献。希望在未来的时间里,有更多的开发者和企业能够加入我们,和我们一起持续探讨人工智能的开放与创新,加速应用落地,推动产业变革。
刘倩,百度AI技术生态部高级经理,百度AI平台产品负责人。