【机器视觉】AI场景的价值体现——视觉 AI 技术落地实践

杨帆,商汤科技联合创始人、副总裁,EGO 北京分会会员。作为商汤科技工程产品中心总负责人,在泛安防智能视频、移动互联网、金融等行业开发和提供人工智能解决方案。凭借在计算机视觉算法产品化、项目管理、研发管理和团队管理方面十余年的积累和经验,杨帆推动商汤科技在技术应用商业化落地方面取得重大进展,仅 2016 年就获取了数亿元的产品订单。因参与创建商汤科技,并在短短三年内将其打造成为人工智能领军企业的突出表现,于 2016 年当选“北京市优秀青年人才”。


【机器视觉】AI场景的价值体现——视觉 AI 技术落地实践_第1张图片

以下内容由 InfoQ 对杨帆先生的部分采访整理。


“AI 更大的价值在于跟不同的行业结合”


杨帆在计算机视觉技术领域沉浸多年,在微软任职期间,他主要从事计算机视觉、计算机图形学等领域的新技术孵化工作,包括人脸识别、图像物体识别、人像三维重建等;目前商汤的核心技术也是以人脸识别、智能监控、图像识别等为主。作为主导技术落地的负责人,杨帆笑称自己是给公司的研究员们打下手的。杨帆带领逾 200 人的工程开发团队,在泛安防智能视频、移动互联网、金融等行业开发和提供人工智能解决方案,推动商汤科技在技术应用落地方面取得重大进展。

杨帆认为,AI 技术并非新事物,但却在过去的两三年集中爆发,其关键原因就在于今天对语音、图像、视频,有了更加信息化的处理技术,在各个环节上具备了更强的技术储备。从技术到落地,AI 技术所实现的这一切,都离不开场景的支持。

AI 技术继承了多种基础技术,在面向工业、金融、医疗、家居、自动驾驶、安防、物流、农业等不同应用场景的解决方案,比如 AI 和医疗的融合应该会体现在智能设备和识别诊断主要两个方面;AI 和金融的整合使金融交易和管理更加安全,实现精准营销、大数据征信和普惠金融;AI 和安防的融合实现智能监控、安保机器人等应用场景;AI、大数据等这些东西纯谈概念是没有任何意义的,最终都要回归场景,可复用的基础技术和平台工具固然重要,但只有落在应用场景里,我们才知道其明确的价值在哪里。


业界曾出现一种批评的声音,称现在很多公司和开发者其实对于深度学习的运作原理并不清楚,只知道应用,却不知其所以然。


杨帆表示:“学术界有两套观念,一套观念说知其然不知其所以然是离经叛道、是不对的。对于这个观念,杨帆表示认可,其实现在已经有很多团队,包括商汤也投入力量在进行更加前沿、更加基础性的科研,“这样的基础科研能够指导我们将来在正确的方向上走得更远。”但杨帆认为,基础研究与应用科研,二者不可偏废,完整的科学体系和持续的方向性指引非常重要,但是实证科学也非常重要,企业最终还是要以技术落地的结果说话。”


人脸识别大行其道,不免让人对这项技术及其背后的公司产生了许多好奇。商汤的人脸识别技术到底有何门道?


对于这两年非常火的“刷脸”,开始有各种基于人脸验证能力的实用化场景。在互联网信息安全方面,对于账户的盗用能够更好的分析和调查,包括线上的手机端、桌面端、H5,包括定制的摄像头。操作逻辑非常简单,最开始做刷脸的注册,现在刷脸的支付,手机逐渐去进行刷脸的解锁。在对于个人的认证上,也有非常多的价值。人脸识别的技术,可以判断操作手机的是不是真实的人。有一个活体检测的技术服务,也包括在线下一体机的形态。对身份证的关键信息进行扫描,包括对身份证内部照片的读取和当前采集人之间进行判断。基于人像的身份认证也是一个非常有价值的工作,它是一个特殊的跨行业的解决方案。这个解决方案现在已经从线上到线下开始极大范围地蔓延。对中国来说,个人公民身份信息的实名制是一个非常重要的诉求,这个诉求能够有效地帮我们在一定程度上解决互联网的安全问题、解决线下的公共安全问题。所有线上的互联网行业应用,到各种线下行业,包括机场、超市、酒店,都会有越来越多的对于个人身份信息核验的强烈需求,商汤在这方面也提供了非常完整的解决方案。


大家都关注识别正确率,在实际场景中正确率是否为最关键因素?


近几年,很多公司在人脸识别技术上投入了大量的研发并取得了亮眼的成绩,其中识别率一直是各家宣传的重点,今年我们能在各类报道中频繁看到各种 99%、99.4%、99.8% 等。虽然企业这么宣称,但实际背后蕴含的差异是非常大的,它会有非常多影响因素,所以准确率跟行业背景以及前置假设会是一个强相关的关系。而不同的场景下取得的识别准确率很难做类比。

当识别率达到 99% 以后,人脸识别技术面临的难点主要在于,如何在不同行业场景中深化这项技术。虽然看上去 99% 的识别率已经很高了,但不同行业场景对于识别率的要求不同,99% 可能只是该技术得以使用的入门条件;而安防场景下,照片模糊、有遮挡、角度不佳都给人脸识别带来了更现实的挑战。

【机器视觉】AI场景的价值体现——视觉 AI 技术落地实践_第2张图片

“看似同质化很强、很简单的人脸识别,细分的技术场景其实非常复杂,所以脱离场景去谈技术是没有太大意义的,今天能看得到的,包括以安防、手机这样的一些重点行业为代表,对于真正的人脸识别技术的全面深化存在着非常多的挑战,值得我们去攻克。”


那么,怎样判断一个行业是否具有做 AI 场景的价值?如果从商汤自身说起,在做 AI 平台化的进程中,遇到过哪些挑战和问题?


1、看需求

首先,需求得是真实的。杨帆举了个具体的例子:有一个家电厂商想通过人脸识别功能,实现“我进去之后这个房间自动调节成 16 度,我母亲进这个房间自动调节成 26 度”。我问他:“如果你和你母亲一块进去怎么办,如果你背着身进去怎么办?”他说这个需求,其实最好的解决办法就是摇控器。

其次,需求得是刚性的。需要考虑用户愿不愿意买单,愿意花多少钱买单?往后更深层次的逻辑链,需要对场景的更深的了解。

2、规模化

今天完成一套解决方案成本很高。人脸识别这样的技术,在不同的场景中技术差异很大。我今天做金融,1:1 的认证,错误率做到百万分之一,千万分之一,准确性非常高,在金融场景中非常好用。如果放在安防的场景下,安防要求百万人的黑名单库。而且黑名单库还要有误报,每一次误报有一个出警。同样是人脸识别,不同场景下关注的技术指标和任务是完全不同的。所以同样一个技术概念,在不同场景下的差异性非常明显。再者技术什么时候成熟需要在特定的需求场景下,离成熟多远要有一个预判力。

3、数据闭环

做 AI 技术,数据闭环是非常重要的环节。为什么?我们做视频的会发现,当你技术不成熟的时候你的业务不能用,业务没有落地的时候就没有数据。做不好,就形成死循环。这样的死循环如何去打破?原动力的突破来自于技术,当你的技术有小的突破,把其他场景迁移过来。技术的突破可以带来业务的落地,业务的落地带来数据的累积,数据的累计可以带来技术的进步。这样的数据闭环,帮助整体业务拓展并能带来非常大的价值。今天,数据面临隐私性和安全性的质问和考验。包括区块链在内的很多技术,还有一些非技术的方式方法,可以带来更深层次的探索。

4、商业化

光做出好产品是不够的,还要在市场上真的有价值,并且能持续保有竞争力。任何新技术都会随着时间的推移而扩散,一般所拥有的时间窗口最多也就是一年多的时间。

在这一段时间内,如何看待当前所面临的场景?在这个场景中技术到底占据多大的地位? 是非关键性的应用还是关键性的应用?技术上的突破和分配,是否产生根本性的问题?在技术的壁垒期,我们能否利用这一段时间构建起技术以外的壁垒?

只有壁垒构建出来,利用时间窗口期把技术优势转化成其他的竞争性壁垒,这样的行业才值得去做。

5、技术创新驱动

早在一两年前,我们就搜集到大量用假照片和视频去攻击刷脸识别的行为,各种各样的案例。当我们拥有大量来自真实业务的攻击数据时,就能够针对图像视频各种各样的攻击方式进行非常好的防范,这来自于大量线上攻击的业务数据的累积,以及对这些数据的二次挖掘和利用。

这个给我们什么样的启示?做刷脸一开始是做人脸识别,但后来我们发现人脸识别不是最重要的,最重要的活体识别,分清到底是一个真人还是仿冒攻击。只有深入场景,才能发现你所面临的技术挑战跟你之前想象的不同。当行业落地的时候所面临的技术挑战,实际上需要重新定义、分解和解决。

从这五个闭环能够帮助我们去判断,把一个 AI 技术应用在某一个场景是否真的有价值,是否真的有意义,是否带来更大的用户价值。从这几个角度大家去进行分析判断,会有一个相对比较好的结论。


想把落地场景做好,复合型技术人才尤为重要


如杨帆所说,真正去看行业落地的时候,往往都是不同的技术叠加和组合的应用,这里面人脸识别和动作识别是最关键的技术,但实际上想把落地场景做好,一定需要多种技术组合。杨帆表示,将创新技术转变为实际产品是一条满是荆棘的道路,行之不易,而其中最大的难点,一是如何选对方向和时机,二是如何找到合适的人才。

行业落地需要各种综合性的关键技术的整合。行业的需求往往是一些相对模糊的,而且从技术上来看是非常不明确的东西,这时候就需要有人有足够的能力去一一拆解。在杨帆看来,找到或培养一些既有技术背景、又对行业有足够深的理解的人才,是企业实现 AI 技术落地最关键的一点。他说到,“人才问题、团队组织问题、发展问题,特别是做 2B 行业,标准化与非标准之间的平衡性掌握,任何一个技术性产品落地会面临的共有问题,做 AI 技术落地,这些问题一个都不会少,而只会更严重。AI 人才是个更大的坑,AI 的技术性更深重,从过往来看,它跟行业的结合更弱,所以你想要真正去打磨出一个符合真正行业需求的产品的时候,需要把对行业的理解和对技术的理解融合在一起,这是当前最具挑战任务之一,因为过去可能这个世界上基本不存在这样的人,对行业有理解的人很少。”


结语

视觉 AI 技术的落地与 AI 人才的培养是一个复杂而庞大的话题,需要对技术和人才都有比较深刻的理解和认知。2018 年 1 月 5 日,移动技术创新大会上,杨帆也会针对 AI 的应用实践展开深入分享,感兴趣的同学可以点击阅读原文报名,现场与杨帆深入探讨和切磋!



 640?wx_fmt=png



人工智能赛博物理操作系统

AI-CPS OS

人工智能赛博物理操作系统新一代技术+商业操作系统“AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利用AI-CPS OS形成数字化+智能化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生。


AI-CPS OS的真正价值并不来自构成技术或功能,而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务数据+分析一体化,这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合,没有颠覆现状的意愿,这些将不可能实现。


领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位:

  1. 重新行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?

  2. 重新构建企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?

  3. 重新打造自己:你需要成为怎样的人?要重塑自己并在数字化+智能化时代保有领先地位,你必须如何去做?

AI-CPS OS是数字化智能化创新平台,设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端,可以帮助企业将创新成果融入自身业务体系,实现各个前沿技术在云端的优势协同。AI-CPS OS形成的字化+智能化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置:

  1. 精细种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。

  2. 智能:模型随着时间(数据)的变化而变化,整个系统就具备了智能(自学习)的能力。

  3. 高效:企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力,这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。

  4. 不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。

  5. 边界模糊:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。

AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长:

  1. 创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;

  2. 对现有劳动力和实物资产进行有利的补充和提升,提高资本效率

  3. 人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间


给决策制定者和商业领袖的建议:

  1. 超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;

  2. 迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新

    评估未来的知识和技能类型;

  3. 制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开

    发过程中确定更加明晰的标准和最佳实践;

  4. 重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临

    较高失业风险的人群;

  5. 开发数字化+智能化企业所需新能力:员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。


子曰:“君子和而不同,小人同而不和。”  《论语·子路》云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。


如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!


新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。





产业智能官  AI-CPS



用“人工智能赛博物理操作系统新一代技术+商业操作系统“AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链





640?wx_fmt=png

640?wx_fmt=png


长按上方二维码关注微信公众号: AI-CPS,更多信息回复:


新技术“云计算”、“大数据”、“物联网”、“区块链”、“人工智能新产业:智能制造”、“智能农业”、“智能金融”、“智能零售”、“智能城市、“智能驾驶”新模式:“财富空间、“数据科学家”、“赛博物理”、“供应链金融”


官方网站:AI-CPS.NET




本文系“产业智能官”(公众号ID:AI-CPS)收集整理,转载请注明出处!



版权声明产业智能官(公众号ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:[email protected]





你可能感兴趣的:(【机器视觉】AI场景的价值体现——视觉 AI 技术落地实践)