旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问

来源:新智元

【导读】从深度学习算法、计算机视觉算法到AIoT算法,从开源框架旷视天元到AI生产力平台Brain++,旷视十年故事,旷视首席科学家、旷视研究院院长孙剑讲给你听。

万万没想到,我和小伙伴们被旷厂拿去「炼丹」了。


没错,就是这个炼丹炉!


站在炉子中央,各种算法代码眼前飞闪,让我体验了一把时空穿梭的快乐。


‍OMG!真·颅内高潮...

业界认为「炼丹」过程正如算法研究过程。

众所周知,AI的三大支柱分别是数据、算法、算力。

那么在炼丹过程中,数据便是金木水火土等自然元素,算法框架是用来炼丹的炉子,算力就是炼丹炉下的三昧真火。

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第1张图片

元素全不全,炉子好不好,火旺不旺决定了AI开发者能不能练出一颗AI的「灵丹妙药」。

从2014年至今,中国新一代炼丹宗师旷视经过多年的磨练打磨,打造了「炼丹房」—— Brain++。

MegEngine(深度学习框架天元)是丹炉,MegData(数据管理平台)是元素,MegCompute(深度学习云计算平台)便是那三昧真火。


这次,「炼丹房」 Brain++ 迎来了全新升级!

升级后的炼丹房,「自动」成为最大特色,炼丹师们不再需要经过九九八十一天这么漫长的时间来炼制丹药。

这个平台提供了怎样的最新功能,让AI开发者们更轻便地生产算法?

Brain++「神助攻」:一个「旗帜检测」算法诞生

熟悉旷视的人都应该知道,Brain++ 是旷视在AI领域创业多年的致胜法宝。

它将算法、算力和数据能力集为一体,核心能力包括:

数据的处理、清洗和管理能力,算力的共享、调度和分布式能力,算法的训练、推理及部署能力。

全面覆盖了从 AI 生产(输出算法模型)到应用(实现算法工程化封装)各环节。

因此,Brain++被内部定义为「AI生产力平台」。

但时局变了,数据满溢,算力飞升,算法无处不在。许多开发者们真正面临的挑战是:如何让算法生产更加高效?


要知道,算法生产能力决定算法价值上限。

当前的算法生产不仅仅是模型的训练,还包括需求分析、数据处理、上线部署、落地应用4个环节。

过程标准化是影响算法生产的关键要素,只有过程标准化才能实现算法生产的自动化。

让算法生产迈向自动化时代,便是Brain++迎接这一挑战的底气!

自动化的数据管理和质检——自动推荐合适的训练算法和模型——自动检查算法准确率并给出优化建议便是升级后Brain++的最新功能。

举个真实场景中的例子,

在钢铁冶炼厂中,存在一些比较危险的设备。根据生产安全的要求,这些设备周围需要插小红旗来做警示和标志。

如何能够检测出小红旗是否还插着?

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第2张图片

这就需要做一个红旗检测的模型,通过安装的摄像头来进行自动化检查。

需求明确后就需要进行算法生产了。

首先,Brain++提供自动化的数据管理和质检,包含十余种质检策略,这个过程中可以排除无意义的数据。

下面这2个红旗就是通过自动化平台所发现,图片的画风其实和我们真实场景中的差别非常大,就属于一些无效数据,或者说噪音数据。

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第3张图片

平台自动检测出后,就会在训练模型前帮你剔除。

然后便开始模型自动化训练,平台会根据部署资源的要求,为开发者自动推荐最合适的训练算法和策略。

这一环节中,就不需要开发者自己去学习到底应该怎样去选择算法或者调优模型。

接下来便是算法调优分析,Brain++集成十余大类不同的结果分析和对应的调优策略,比如漏检/误检结果呈现。

当红旗检测模型训练完成后,将其放到实际应用场景中测试,黄色框就是一次训练后的算法检测出来红旗的位置。

说明这一算法存在明显误检问题,特别可能在这样的一个场景误检率比较高,AI生产力平台便可帮助开发者自动发现问题,并给出针对性优化建议。

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第4张图片

总的来看,当我们分析完想要做一个旗帜的检测需求之后,首先需要2个小时来做一个图像的质检和旗帜的标注,之后选择一个GPU的训练环境,模型训练的时间大概花费一个小时左右的时间。

在上线部署后,根据刚刚提到的分析和调优策略,研究人员进行了2轮左右的迭代,一个「旗帜检测」算法就诞生了!

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第5张图片

你所感受到的便捷,是旷视通过总结过去10年算法生产落地的海量经验,探索出一套「快速、低成本生产算法」的模式,并将其沉淀在Brain++。

这十年,旷视AI创新走过怎样一个历程?

7月16日,由旷视首席科学家、研究院院长孙剑领衔的技术团队在2021旷视技术开放日(MegTech 2021)上分享了旷视十年来在AI技术上的实践和思考。

十年实践,首席科学家孙剑发AI「灵魂」三问

今年,是旷视成立的第十年。

我们来聊一聊旷视这十年的进阶之路。

首席科学家孙剑以旷视为例,总结了过去十年中国AI技术价值的发展历程。

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第6张图片

2011年前后,AI发展的重点是基础科研。基础科研的关键点是突破单点算法,让AI率先在互联网等数字化程度高等领域应用落地,变得真正可用。

2015年起,AI需求越来越多,AI商业化落地也越来越多。这个过程中,算法在不断拓展应用的边界,从算法到软硬结合,AI创造的价值越来越大。

从2020年开始,AI成为新基建的重要部分,持续降低算法门槛,让AI生产变得更加容易,基础设施需要AI普惠化。

AI有没有用?AI在哪里用?AI易不易用?

这是AI行业的「灵魂」三问,是所有AI企业需要回答的问题。

孙剑认为,AI有没有用归根到底是看AI基础科研有没有突破。

基础科研是AI创新突破的基石,需要长期主义的坚持。

对旷视来说,要构建科学价值和产业价值统一的基础科研体系。

十年来,旷视不断突破创新:

在学术上发表85篇顶级会议论文,在竞赛上斩获40项冠军,在实用上研发了包括ShuffleNets系列在内的众多基础模型,已经广泛应用在手机等智能设备上,推动软硬协同发展。

基础科研有了,落地才是科研的价值,这就需要解决「AI在哪里用」的问题。

对于旷视,一直瞄准的是消费物联网、城市物联网和供应链物联网三大场景。

AI是核心能力,IoT是落地场景,在数字世界与物理世界融合的智能化时代,AI算法正在为产品带来更多的价值提升。

旷视认为,「算法不只让很多产品从好变更好,更能让产品从不可能变可能。」

在旷视十年的AI实践落地中发现,算法已不再仅仅是「软件物料」,而是成为「核心组件」。

从科研到落地,算法正在创造越来越大的价值,也在开始重新定义软硬件。

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第7张图片

旷视研究员范浩强在MegTech 2021上的分享

AI落地是我们所有人都在讲的问题,但是当前,大量算法生产过程还是非标准化。因为非标准化所以算法生产过程充满不确定性。

旷视认为,落地实用是检验算法的最高标准之一,而生产落地实用算法的过程「只有先标准化才能自动化」,才能更进一步实现规模化的普惠易用。

从2014年至今,持续打磨升级的AI生产力平台Brain++,就是旷视推动算法生产迈向自动化时代的AI基础设施。

为什么是旷视?

不是炼丹「上瘾」,是AI进化

旷视是一家靠算法起家的公司。

准确来说,可以细分为两类:

一类是以深度学习(DL)和计算机视觉(CV)为基础的核心算法。

另一类则是行业算法 (或者称AIoT算法)。

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第8张图片

旷视的算法之路,经历了从核心算法突破,到行业算法落地和创新,再到算法生产平台的拓展过程。

MegTech 2021上,旷视展示了其算法量产星空图。

算法量产不是一个单一产品,更不是「上瘾」,而是一种生产模式的理念革新和生产力进化。

旷视现场通过一系列技术Demo演示,系统展示了其最新的技术成果。

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第9张图片

旷视研究院推出了面向服务器和下一代AI芯片的通用模型RepVGG,其在开源后Github star已超过1800。

还推出全景视频实时拼接算法。

全景视频拼接的实现,需要多个摄像头在同一场景下采集不同方向视频,然后逐帧地将各个方向的视频帧拼接起来,最终得到360度全景视频,甚至360度*180度的球面全景视频。

其核心是运用基于光流的多摄AI拼接算法,同时依靠实时动态无缝拼接网络模型,解决了多摄拼接计算量大、拼缝明显,以及拼接无法动态更新的技术难题。

还有单目3D车路感知:仅用单目可见光相机,就可以实现车路信息的3D感知。


旷视MegTech 2021上还展示了,目前性能最强的端到端实时全卷积全景分割算法,以及挑战经典,目标检测架构创新的YOLOF。

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第10张图片

从基础科研,到行业落地,再到基础设施,这是人工智能技术价值跃迁的三个关键。

旷视正是沿着这样的路线在不断创新,务实落地。预研一代、孵化一代、交付一代,这是旷视技术创新研发模式。

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第11张图片

在技术开放日现场,旷视将这一套创新研发模式首次对外完整的呈现出来。

孙剑总结道,「聚焦最优秀的人才,一起做最好的科研,通过产品让科研成果创造价值,不断探索新领域,这是旷视的秘诀,也是AI技术价值跃迁的秘诀。」

对了,忘了告诉你,这是一个北京新晋AI网红打卡圣地。

不要太燃~

推荐阅读

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 分层级联Transformer!苏黎世联邦提出TransCNN: 显著降低了计算/空间复杂度!

  • 清华姚班教师劝退文:读博,你真的想好了吗?

  • 2021李宏毅老师最新40节机器学习课程!附课件+视频资料

  • 最强通道注意力来啦!金字塔分割注意力模块,即插即用,效果显著,已开源!

  • 登上更高峰!颜水成、程明明团队开源ViP,引入三维信息编码机制,无需卷积与注意力

  • 常用 Normalization 方法的总结与思考:BN、LN、IN、GN

  • 注意力可以使MLP完全替代CNN吗? 未来有哪些研究方向?

  • 清华鲁继文团队提出DynamicViT:一种高效的动态稀疏化Token的ViT

  • 并非所有图像都值16x16个词--- 清华&华为提出一种自适应序列长度的动态ViT

重磅!DLer-计算机视觉&Transformer群已成立!

大家好,这是计算机视觉&Transformer论文分享群里,群里会第一时间发布最新的Transformer前沿论文解读及交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如Transformer+上交+小明)

旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问_第12张图片

???? 长按识别,邀请您进群!

你可能感兴趣的:(算法,大数据,编程语言,机器学习,人工智能)