昨天上午,为期三天的小米 2019 开发者大会在北京国贸大酒店正式拉开帷幕。本次大会以「智能新时代」为主题,围绕「5G + AIoT」核心战略,向现场的开发者们展示、分享了小米在物联网、人工智能、大数据等技术领域中的探索实践,并公布了多项核心技术及开源项目的开发进展。
今年初,小米就已经启动了「手机+AIoT」的双引擎战略,并宣布将在未来的 5 年时间内向 AIoT 领域投入 100 亿元。小米集团创始人、董事长兼 CEO 雷军在会上再次强调了该战略的重要性,他认为 5G 将全面赋能 AIoT,并使其成为潜力、规模都更大的市场,「5G + AI + IoT」将组成下一代的超级互联网,同时这也是一场涉及平台、算力、网络的全面革命。
根据小米集团第二季度财报上的数据显示,截至到今年 6 月 30 日,小米 IoT 平台已支持超过 2200 款智能产品,接入了 1.96 亿台智能设备,同比涨幅高达 69.5%,超过 300 万人拥有 5 个及以上的小米 IoT 设备,同比增长 了 78.7%。
近年来,小米不断加大在技术研发上的投入,成立集团技术委员会的目的,就是希望能围绕其核心战略持续打磨关键核心技术。在过去的三年中,小米在研发上已投入 111 亿元,仅 2018 年就投入了 58 亿元,同比提升83.3%。此外在专利方面,小米已在人工智能领域申请了 684 项专利。
在本次大会上,小米集团副总裁、集团技术委员会主席崔宝秋公布了包括移动端深度学习框架 MACE、小米自然语言处理平台 MiNLP、Key-Value 存储系统 Pegasus、小爱同学在内的多项核心技术及重点产品的最新动态。
小米手机近年来屡屡在相机相关技术上取得突破,比如刚刚发布不久的小米 CC9 Pro 尊享版就凭借总分 121 分取得了 DXOMARK 并列第一名的成绩。其影像技术不断进步的背后,不仅是硬件上投入的提升,基础画质算法、夜景算法、HDR 算法、人像算法等计算机视觉相关算法所提供的支持也是关键。
而除了计算机视觉算法之外,小米 AutoML 与移动端深度学习框架 MACE 带来的帮助同样也很重要。目前小米 AutoML 团队已通过人工智能算法训练出更高效、精准的模型,并在 ImageNet 上取得了不错的成绩。AutoML 已应用于小米相机场景识别、相册分类等多个功能上,显著加快了人工智能相关技术的落地速度。
相机像素的不断提升,就会对手机计算能力提出更苛刻的要求,而小米自研的移动端深度学习框架 MACE,则在应对这一挑战时发挥了重要作用。MACE 是专为移动端异构计算平台优化的神经网络计算框架,它能够帮助开发者将深度学习模型部署到各种移动设备或 IoT 设备上。而通过 MACE,小米也能够在移动端部署各类深度学习应用以及计算机视觉、语音识别等相关算法。
小米于去年 6 月宣布 MACE 开源,目前据不完全统计,MACE 在各平台上每天的调用推理次数已超过 5000 万次。在本次大会上,小米正式推出了 MACE 0.12,新版本将拥有更丰富的异构计算算子,降低了跨设备运行性能损失,并新增了 Kaldi 语音识别算子支持以及 CMake 支持。
未来,MACE 计划将支持人脸检测、人脸识别、语音识别、目标检测的端到端 SDK ———— MACE-Kit 进行开源,帮助开发者简化开发流程。另外 MACE 还准备为微控制器提供支持,以全面适配手机与 IoT 设备超低功耗推理场景。
小米在自然语言处理方面实际上已深耕多年,小米自然语言处理平台 MiNLP 正是小米基于声学技术自主研发的人工智能平台,MiNLP 1.0 已于今年初正式发布,目前 MiNLP 每天的调用次数已超过 60 亿次。
在本次大会上,小米宣布正式将 MiNLP 升级为 1.2 版本,其中的变化包括调用模式从本地调用提升为支持云端、本地、移动端三端调用,以及分析功能从词法分析拓展到句法和语义分析。MiNLP 1.2 还支持吸收和集成当前的前沿进展,并进行技术创新,同时其支持的业务范围也进行了全面拓展,已实现支持多项不同业务。
借助 AutoML 与 MiNLP 的支持,小爱同学得以不断扩展新功能,并为更多用户提供服务,其已成为世界上最繁忙的人工智能系统之一。根据财报数据显示,2019 年 6 月搭载小米人工智能助理「小爱同学」的智能音箱产品出货量已超过 400 万台,小爱同学月活用户已超过 4990 万人,同比增长了88.3%,有 45% 的智能音箱用户使用语音来控制 IoT 设备。
在本次大会上,小爱同学正式公布了全新的 3.0 版本,其中包括全双工自然连续对话、AI 电话助理、语音遥控器、小爱捷径 2.0 等多个新功能,其也将成为首个在手机上实现自然连续对话的智能语音助理。
小米于 2017 年宣布开源的 分布式 Key-Value 存储系统 Pegasus,也在这次大会上宣布更新到 1.12 版本。Pegasus 具有高可用、高性能、强一致性、易伸缩等优势,最初是用于弥补 HBase 在可用性与性能上的不足的,而 Pegasus 1.12 将提供 HTTP 接口以获取集群元信息,提供更好的多租户支持能力,以及支持接入 Prometheus 监控系统。
目前 Pegasus 1.12 已在 GitHub 上线,共获得超过 1100 个 Star,有超过 200 位社区开发者参与开发。
长期以来,小米一直在倡导、支持开源,以开源社区 HBase 为例,小米拥有 9 个 Committer、3 个 PMC 成员,今年的代码贡献量占比为 33%。
此外,国际语音识别与人工智能技术专家、开源语音识别系统 Kaldi 之父 Daniel Povey 也在大会上宣布正式加入小米集团。目前最新的 MACE 0.12 已支持大部分 Kaldi 系统内组件以及 ONNX 形式的的 Kaldi 模型,还提供了 Kaldi-onnx 转换工具。
崔宝秋在会上强调,小米想要打造的是无处不在、无所不能的智能系统。正因如此,小米才有必要将 IoT 升级为 AIoT 并经历了三个重要转变:
首先是从图形界面互动,转变为语音与图像界面交互。其次是从个体转变为整体,不同的设备互相连接,形成生态体系。最后是从互联互通,转变为以人为中心的智能服务。
未来,小米在技术研发上将继续秉承深耕赋能、开源共享、开放共赢的策略,不断挑战当前技术的临界点,在创新中实现突破。
GitHub 相关项目地址:
移动端深度学习框架 Mobile AI Compute Engine (MACE)
分布式 Key-Value 存储系统 Pegasus
语音识别系统 Kaldi