【人工智能】未来三年(2018-2020),我们在新一代人工智能产业能做什么


国务院于2017年7月21日印发了《新一代人工智能发展规划》,提出了面向2030年我国新一代人工智能发展的指导思想、战略目标、重点任务和保障措施,部署构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国。

工信部于2017年12月14日印发了《促进新一代人工智能产业发展三年行动计划(2018-2020年)》,明确以信息技术与制造技术深度融合为主线,以新一代人工智能技术的产业化和集成应用为重点,推进人工智能和制造业深度融合,加快制造强国和网络强国建设。

新一代人工智能关键共性技术的研发部署是以算法为核心,以数据和硬件为基础,以提升感知识别、知识计算、认知推理、运动执行、人机交互能力为重点,形成开放兼容、稳定成熟的技术体系。主要包括:知识计算引擎与知识服务、跨媒体分析推理、群体智能、混合增强智能、自主无人系统、虚拟现实智能建模、智能计算芯片与系统和自然语言处理等8项技术。


那么,未来3年,我们作为该领域的从业者,到底能做什么呢,请继续往下看:

培育智能产品

发展智能控制产品

加快突破关键技术,研发并应用一批具备复杂环境感知、智能人机交互、灵活精准控制、群体实时协同等特征的智能化设备,满足高可用、高可靠、安全等要求,提升设备处理复杂、突发、极端情况的能力。

培育智能理解产品

加快模式识别、智能语义理解、智能分析决策等核心技术研发和产业化,支持设计一批智能化水平和可靠性较高的智能理解产品或模块,优化智能系统与服务的供给结构。

推动智能硬件普及

深化人工智能技术在智能家居、健康管理、移动智能终端和车载产品等领域的应用,丰富终端产品的智能化功能,推动信息消费升级。

重点涉及的产品包括:

  1. 智能网联汽车

  2. 智能服务机器人

  3. 智能无人机

  4. 医疗影像辅助诊断系统

  5. 视频图像身份识别系统

  6. 智能语音交互系统

  7. 智能翻译系统

  8. 智能家居产品

突破核心基础

智能传感器

到2020年具备在移动式可穿戴、互联网、汽车电子等重点领域的系统方案设计能力。

神经网络芯片

到2020年在智能终端、自动驾驶、智能安防、智能家居等重点领域实现神经网络芯片的规模化商用。

开源开放平台

到2020年面向云端训练的开源开发平台支持大规模分布式集群、多种硬件平台、多种算法,面向终端执行的开源开发平台具备轻量化、模块化和可靠性等特征。

深入发展智能制造

智能制造关键技术装备

到2020年,高档数控机床智能化水平进一步提升,具备人机协调、自然交互、自主学习功能的新一代工业机器人实现批量生产及应用;

增材制造装备成形效率大于450cm3/h,连续工作时间大于240h;

实现智能传感与控制装备在机床、机器人、石油化工、轨道交通等领域的集成应用

智能检测与装配装备的工业现场视觉识别准确率达到90%,测量精度及速度满足实际生产需求;

开发10个以上智能物流与仓储装备

智能制造新模式

离散型制造业企业以生产设备网络化智能化为基础,应用机器学习技术分析处理现场数据,实现设备在线诊断、产品质量实时控制等功能。

流程型制造企业建设全流程、智能化生产管理和安防系统,实现连续性生产、安全生产的智能化管理。

打造网络化协同制造平台,增强人工智能指引下的人机协作与企业间协作研发设计与生产能力。

发展个性化定制服务平台,提高对用户需求特征的深度学习和分析能力,优化产品的模块化设计能力和个性化组合方式

搭建基于标准化信息采集的控制与自动诊断系统,加快对故障预测模型和用户使用习惯信息模型的训练和优化,提升对产品、核心配件的生命周期分析能力。

到2020年,智能制造推进效益:

  1. 数字化车间的运营成本降低20%,产品研制周期缩短20%;

  2. 智能工厂产品不良品率降低10%,能源利用率提高10%;

  3. 航空航天、汽车等领域加快推广企业内外并行组织和协同优化新模式

  4. 服装、家电等领域对大规模、小批量个性化订单全流程的柔性生产与协作优化能力普遍提升;

  5. 在装备制造、零部件制造等领域推进开展智能装备健康状况监测预警等远程运维服务

构建支撑体系

行业训练资源库

面向语音识别、视觉识别、自然语言处理等基础领域及工业、医疗、金融、交通等行业领域,支持建设高质量人工智能训练资源库、标准测试数据集并推动共享,鼓励建设提供知识图谱、算法训练、产品优化等共性服务的开放性云平台

标准测试及知识产权服务平台

到2020年,初步建立人工智能产业标准体系,建成第三方试点测试平台并开展评估评测服务;在模式识别、语义理解、自动驾驶、智能机器人等领域建成具有基础支撑能力的知识产权服务平台

智能化网络基础设施

到2020年,全国90%以上地区的宽带接入速率和时延满足人工智能行业应用需求,10家以上重点企业实现覆盖生产全流程的工业互联网示范建设,重点区域车联网网络设施初步建成。

网络安全保障体系

到2020年,完善人工智能网络安全产业布局,形成人工智能安全防控体系框架,初步建成具备人工智能安全态势感知、测试评估、威胁信息共享以及应急处置等基本能力的安全保障平台




李杰:“预测”是智能制造的重要体现


顾问:李杰  信息化顾问团                    


这一周有个事刷遍朋友圈,就是支付宝的2017总结,同时还弄了个2018年的预测。心想,大概是依靠支付宝后台的大数据做个归纳统计吧。预测哪那么容易做啊,毕竟个人各异。后来发现预测的词汇也就几十个,更加加深了自己最初的判断。

 

同时最近正好在看统计的资料,加上去年碰到几个预测方面的需求,所以在新年开始之际,借此写下这篇文章谈谈个人对预测在智能制造上的应用的初步理解。

 

本人一直觉得,预测是智能化的最好体现也是最难体现,还是那句老话”千金难买早知道“,如果你比别人早知道底牌,你一定可以每次都赢。

 

先谈谈预测的方法:


其实人类一直在做预测方面的实践。只是,随着科技的发展,使用的技术和方法不同,从以前的统计学方法到人工智能再到现在的机器学习和深度学习。统计学基本上都快有2,3百年的历史,AI也快60多年,而现在最火最新的深度学习也快10年。

 

【人工智能】未来三年(2018-2020),我们在新一代人工智能产业能做什么_第1张图片

图片来源于Nvidia 

 

AI现在分为两种:统计型AI或机器学习在模式识别方面很厉害,但它并不使用逻辑。而符号型的 AI 可以使用预先制定的规则来理解关系,但是在临场处理中表现并不好。

 

再谈谈预测在智能制造的应用:


去年主要碰到了2个方面的预测应用需求,一个是销售的预测,另一个是预测性维护。关于销售预测,不同行业不同特性,预测的期望要求和结果会很不相同。加上前期提过一次,这次我就谈谈预测性维护。


预测性维护(PdM,Predictive Maintenance),首先谈谈它的简写,是PdM小写的d,不要和PDM混淆,也不是PM毕竟PM在TPM的体系中,标识的是Preventive Maintenance。


去年,在做预测性维护的项目的开始,一度纠结Predictive Maintenance和Preventive Maintenance到底有什么区别,因为从英文翻译来看,Preventive也有预防的意思。通过项目的过程和不断学习的过程,逐步体会到了两者的不同。


谈起维护大家一定听过TPM的概念(网上太多资料可查就不描述了)。我们来详细谈一下维护的等级,我通常划分成2类3层级:


2类指的是计划维护和非计划维护,3层级指的是


1、事后维修-BM(Breakdown Maintenance) 这是最早期的维修方式,即出了故障再修;


2、预防维护-PM(Preventive Maintenance)这是以生产时间,生产数量因数基于计划的维护;


3、预测性维护-预测性维护(PdM)流程旨在检测最终会导致故障的设备状态,然后预估出距离故障发生还有多少时间。


3层里面的第一层和第三层是非计划的,只有第二层是计划内的。

 

有些地方会把预测性维护也解释为条件型维护Condition Based Maintenance(CBM),但我个人觉得不是很确切。毕竟预防维护PM也是有条件的维护,根据时间或者根据次数,这些可能都是根据经验或者供应商而来。但当考虑因数或迭代次数变多的时候,个人觉得PM就自然而然地转向PdM了。


简而言之就是PdM是借助算法分析检测故障发生前的机械状态,并预测更正确的故障发生的时间。但预测性维护的最大价值体现不是延长最大的维护时间点,而是做到维护和使用的最佳Balance,需要找到一个既能提高设备每次使用时间,又能不缩短整个使用寿命,同时维持产品质量品质的维护节点,这涉及到大量的因数,传统经验和方法很难推算出来或者真正明白哪些是主要因数。智能的体现就是要把每项工作逐渐推向极致,从而获得最好的OEE,最好的经济效益。


预测性维护的另一个表现,可能在于不单单只是加工产品的设备需要预测性维护,成品也可以做到预测性维护比如发动机,最好的举例就是你知道你车子的小保养需要什么时候做吗?现在很多可能都是按里程或按时间来做,对于一个开车少的来说一定是浪费的,但你不敢不做,因为你没有数据依靠,会心里没底。加上大数据,云平台,Digital Twin,物联网时代的很多产品都可以慢慢实现预测性维护。


预测性维护的实施过程中的最大难点在于数据的采集和关键因数的判断取舍,其实这也是其他很多预测应用的难点。经验是非常有用的,但当你需要一个更加接近极限的答案时,一定是需要通过不同因子的推算结果和不断实施迭代比较来找出最可靠的答案。这一点AI技术的发展,帮助我们做到无限接近可能。


预测不是求百分百对的解,预测的结果都是错的(也可能小概率的碰巧对),预测带给我们的只是减少偏差,尽量少错,从数据开始,由算法来结束。

【人工智能】未来三年(2018-2020),我们在新一代人工智能产业能做什么_第2张图片

最后,附上PdM的市场预测图(真是哪里都可以看到预测)。




《Science》杂志:机器学习究竟将如何影响人类未来的工作?

雷锋网 

                                                                       

【人工智能】未来三年(2018-2020),我们在新一代人工智能产业能做什么_第3张图片

作者:Smiletalker

概要:《Science》杂志也发表了一篇长文,从几个不同角度详细阐述了机器学习对于未来人类工作的影响。


人工智能、机器学习相关技术已经多次刷新了人们对于「计算机能做什么」的认知,那么紧接着的一个问题就是「计算机会不会替代人类的工作」。李开复就曾经多次在公开场合表示人工智能会取代许多人类工作,而这也已经引起了一定的忧虑和讨论。近日,《Science》杂志也发表了一篇长文,从几个不同角度详细阐述了机器学习对于未来人类工作的影响。


在过去的几十年中,数字计算机已经改变了几乎所有经济部门的工作。由于机器学习(ML)的发展加快了自动化的步伐,我们正处于一个更大、更迅速转变的开始阶段。然而,虽然很明显 ML 是一种「通用技术」,就像蒸汽机和电力一样,产生了大量新的创新和能力,但关于 ML 系统擅长的任务并没有广泛的共识,ML 对劳动力和经济的具体影响的预期也没有达成一致。在本文中,我们讨论了 ML 对劳动力的关键影响,参考了目前这一代 ML 系统可以做和不可以做的事情。工作中的一部分可能是「适合 ML」(SML),但这些相同工作中的其他任务并不适合 ML 的标准;因此,ML 对就业的影响比一些人所强调的简单的替代和替换更为复杂。虽然目前 ML 对经济的影响相对有限,而且我们并没有像有的人宣称的那样面临即将到来的「工作的终结」,但 ML 对经济和未来劳动力的影响却是深远的。


任何有关 ML 可以做什么、不可以做什么、以及可能对经济产生哪些影响的讨论,首先应该认识到两个广泛的基本考虑因素。第一,我们离通用人工智能还很远;第二,机器不能完成人类的全部任务。此外,虽然创新总体上对收入和生活水平的提高是重要的,特别是 ML 之前的第一波信息技术(IT)系统创造了数万亿美元的经济价值,但技术进步也是造成工资不平等的重要因素,尽管造成不平等的因素有很多,比如全球化程度加深,但由于 ML 的巨大而迅速的变化潜力,可能对经济影响造成很大的破坏性,既产生赢家,也产生输家。这将需要政策制定者,商业领袖,技术人员和研究人员的高度重视。


当机器自动执行特定工作或流程中的 适合 ML 的任务时,剩下的不适合 ML 的任务可能会变得更有价值。此外,机器将增强人的能力,使全新的产品、服务和流程成为可能。因此,即使在部分自动化的工作岗位内,对劳动力需求的影响既可能是负面的,也可能是正面的。虽然更广泛的经济影响是复杂的,但与 ML 能力接近的任务上,对劳动力需求更有可能下降,而作为这些系统补充的任务劳动力的需求可能增加。每当 ML 系统跨越一个门槛,在某个任务上比人类更具成本效益时,企业家和管理者为了利润最大化,将越来越多地寻求用机器替代人类。这将影响整个经济,提高生产力,降低价格,转移劳动力需求,重组行业。


我们知道的多于我们所能言说的


正如哲学家波拉尼所说,我们知道的,多于我们所能言说的。认识一张脸、骑自行车和理解言语都是人类非常清楚怎么做的任务,但是我们反思自己如何去做的能力却很差。执行起来轻而易举的任务要整理成正式规则却很难,很多时候我们根本做不到。因此,在 ML 之前,波拉尼的悖论限制了通过编程计算机自动完成的任务种类。但是今天,在许多情况下,ML 算法已经使得训练计算机系统比我们手动编程更精确和更有能力。


一直到近几年,创建一个新的计算机程序都需要涉及劳动密集型的手工编程过程。但是,这个昂贵的过程正日益被增强,或者被一个更加自动化的、在适当的训练数据上运行的 ML 算法流程所取代。这种转变的重要性体现在两个两方面:在越来越多的应用程序中,这种模式可以产生比人类程序员更精确和可靠的程序(例如人脸识别和信用卡欺诈检测);其次,这种模式可以大大降低创建和维护新软件的成本。降低了成本,减少了实验的障碍,并能够探索潜在的计算机化任务,鼓励发展计算机系统,实现许多类型的常规工作流程的自动化,减少或消除人为干预。


在过去的 6 到 8 年里,ML 在这方面的进展尤其迅速,这在很大程度上是因为大量的训练数据,这些数据量足够大,以至于可能捕捉到非常有价值且以前未被注意到的规律,可以在 ML 算法的处理能力范围内进行检查或理解。当有足够多的训练数据集时,ML 有时生成的计算机程序表现胜过人类。(例如皮肤病诊断、围棋、检测潜在的信用卡欺诈)。


算法的改进也是 ML 进展的关键,包括深度神经网络(DNN)和更快的计算机硬件。例如,Facebook 已经都从基于短语的机器翻译模式转换到深度神经网络,每天进行的翻译超过 45 亿次;用于图像识别的 DNN 降低了 ImageNet 上的错误率,ImageNet 是一个包含 10000 多类标注图像的大型数据集,错误率从 2010 年的超过 30% 下降到现在的不到 3%;同样,自 2016 年 7 月以来,DNN 帮助语音识别错误率从 8.4% 提高到 4.9%。图像和语音识别率达到 5% 的阈值非常重要,因为这几乎接近人类在面对类似数据时的错误率。


自动推进的自动化


要产生一个定义明确的学习任务,以便应用 ML 算法,必须要有充分的说明任务、性能指标和训练过程。在大多数实际应用中,要学习的任务与某些目标功能相对应,例如输入医疗患者健康记录,输出患者诊断的功能,或者从自动驾驶汽车的传感器接收输入,然后输出正确的转向命令。最常见的训练过程类型是由目标功能的输入 - 输出对组成的数据(例如与正确诊断配对的医疗记录)。然而获取真实训练数据在许多领域都很困难,如精神病诊断,招聘决策和法律案例。


成功的商业应用的关键步骤,通常包括精确识别要学习的功能;收集和清洗数据以用于训练 ML 算法;通过工程数据特征来选择哪些数据可能有助于预测目标输出,并且收集新的数据以弥补原始特征的不足;尝试不同的算法和参数设置,以优化学习分类器的准确性;并将提供的学习系统嵌入到日常业务运营中,从而提高生产力;如果可能,持续获取更多训练样本。


测量未来自动化程度非常相关的方法是「学徒学习法」,其中人工智能程序作为学徒,通过观察人类的决定来进行学习,并将其作为额外的训练样本。这种方法产生了新的商业模式。


训练学徒模仿人为决策让机器可以从它所协助的多个人的综合数据中进行学习,这导致机器可能最终超过训练它的团队中的每个个体的表现。不过,其学到的专业知识可能仍受到团队成员的技能水平和相关决策变量的可用性的限制。但是,在计算机可以访问独立数据来确定最佳决策(基本事实)的情况下,有可能改进人的决策,从而帮助人类提高自己的绩效。例如,在从皮肤病学图像中对皮肤癌进行医学诊断时,将随后的活检结果作为训练的标准可以产生比人类医生更高诊断准确度的计算机程序。


什么是最适合 ML 的任务


尽管近来 ML 系统的进步令人印象深刻,但它们并不适用于所有的任务。当前的成功浪潮在很大程度上取决于被称为监督学习的范式,通常使用 DNN(深度神经网络)。在非常适合这种用途的领域,ML 非常强大。但是它的能力也比人的决策范围要窄的多,也比人的决策更脆弱,而且这种方法对许多任务是完全无效的。 当然,ML 的技术还在继续进步,DNN 之外的其他方法可能更适合不同类型的任务。 我们下面给出 8 个关键评判标准,以区分适合 ML 的任务和不适合 ML 的任务。


1.明确定义的输入和输出


其中包括分类(例如,区分不同品种狗的图像或根据癌症的可能性标注医疗记录)和预测(例如分析贷款申请以预测未来违约的可能性)。不过,虽然 ML 系统可以根据统计上的相关性来预测与输入(X)有最大关联的输出(Y),但可能无法学习如何判断因果关系。


2.存在、或者能够创建规模巨大、带有成对的输入输出的数字化数据集


可用的训练样本越多,学习就越准确。 DNN 的显着特征之一是在许多领域内的表现似乎并不会在样本超过一定数量之后就停止增长。 在训练数据中捕获所有相关输入特征尤为重要。 尽管 DNN 原则上可以表示任意函数,但是计算机很容易模仿和延续训练数据中存在的不需要的偏差,解决方法是通过聘用专人来标记部分数据或创建全新的数据集,或通过模拟相关的问题设置来创建。


3.该任务提供明确的反馈,具有明确的目标和指标


当我们能够清晰的描述目标,哪怕不能确定实现目标的最佳过程,ML 也能很好的运作。这就像早期的自动化方法,获取个体输入输出决策的能力虽然允许学习模仿这些个体,但可能不能得到最佳的系统最性能,因为人类本身也无法做出完美的决策。 因此,明确界定全系统绩效指标(例如,优化整个城市的交通流量而不是特定路口)为 ML 系统提供了一条黄金标准。 当训练数据按照这种黄金准则进行标注时,ML 就特别有用,因为确定了预期的目标。


4.不需要基于丰富背景知识的很长的逻辑或推理链


ML 系统在学习数据中关联性方面非常强大,但是当任务需要依赖计算机没有的常识或背景知识或复杂计划时,ML 系统的效率较低。ML 在电子游戏中表现出色,这些游戏需要快速反应,并提供即时反馈,但当游戏中最佳选择取决于记忆以前事件的时间和未知背景知识时,效率就会降低,例外是围棋和象棋这样的游戏,因为这些非物理的游戏可以以非常精确的速度进行快速模拟,因此可以自动收集数百万个完全自我标记的训练样本。 但是,在大多数现实世界中,我们无法做到完美的模拟。


5.没有必要详细解释如何做出决策


大型神经网络通过微妙地调整多达数亿个数字权重来学习做出决定。解释这种决定对人类来说很困难,因为 DNN 与人类的思维系统不同。目前的系统在这个方面相对较弱。例如,虽然计算机可以诊断特定类型的癌症或肺炎,甚至比专家医生更准确,但与人类医生相比,它们解释为什么以及如何作出诊断的能力较差。对于许多感性的任务,人类也很难解释,例如,如何从所听到的声音中识别出单词。


6.容错性,不需要最佳的解决方案


几乎所有的 ML 算法都是从统计和概率上推导出解决方案。 因此,很难将其训练到 100% 的准确度。 即使是最好的语音、物体识别和临床诊断计算机系统也会犯错(和人一样)。 因此,对学习系统误差的容忍是制约这样的系统应用的重要标准。


7.学习的现象或功能不应该随着时间的推移而快速变化


一般来说,只有当需要处理的数据和训练的数据分布是类似的结构,ML 算法才能很好地工作。 如果这些分布随着时间而改变,则通常需要重新训练,因此成功取决于相对于新训练数据获取率的变化。


8.没有特别的灵巧性,身体技能或流动性要求


在处理非结构化环境和任务中的物理操作时,机器人与人类相比仍然笨拙。 这不是 ML 的缺点,而是机器人技术自身的局限性。


机器学习对工作的影响


【人工智能】未来三年(2018-2020),我们在新一代人工智能产业能做什么_第4张图片

计算机通过生成式设计方法设计的换热器


之前 ML 对 IT 的影响主要在于一些常规、高度结构化和重复性的任务。这也是劳动力需求下降的一个原因。未来,更广泛的任务将被机器自动化或增强。这包括人类无法解释的任务,但是简单地根据过去的趋势进行推断将是错误的,需要一个新的框架。


一项工作中通常包含许多不同的但相互关联的任务。在大多数情况下,这些任务中只有一部分适用于 ML,而且可能是传统的技术不容易自动化的任务。例如,训练 ML 系统可以帮助律师对案件的相关文件进行分类,但是在访谈潜在的证人或制定策略时使用 ML 就很困难。类似地,ML 系统在阅读医学图像方面取得了迅速的进展,在某些应用中表现超过了人类。然而,与其他医生交流、以及与患者交流和安慰患者的潜在情绪困扰的等任务,都不适合 ML 方法,至少不适合现有的 ML 系统。


这并不是说所有涉及情商的任务都 ML 系统都无法实现。销售和客户互动的某些方面就非常合适。例如,销售人员和潜在客户之间的大量在线聊天记录可以用简单聊天机器人替代,以识别哪些常见的询问最有可能带来销售。也有公司使用 ML 来识别来自视频中人们的微妙情绪。


另一个领域是涉及创意的任务。在旧的计算模式中,需要事先精确地规定一个过程的每个步骤。机器没有任何「创造性」的空间,不能想出如何解决特定问题。但 ML 系统是经过专门设计的,使机器可以自己找出解决方案。所需要的不是预先详细定义过程,而是需要明确规定所需解决方案的性质,并有一个合适的模拟器,以便 ML 系统可以探索可用替代方案并准确评估其性能。例如,设计复杂的新设备在一直是人类比机器更擅长的任务。但是生成式设计软件可以为热交换器等物体提供新的设计,比任何人设计的都能更有效地满足所有的要求(例如重量,强度和冷却速率)外观和触感。


这是「创意」吗?这取决我们如何定义。但以前人类的一些「创造性」任务在未来几年将日益自动化。当最终目标可以被很好地规定并且解决方案可以被自动评估时,这种方法运行良好。因此,我们可以预见这些任务越来越受到自动化的影响。与此同时,人类在更明确界定目标方面的作用将更加重要,这意味着科学家,企业家和那些能够提出正确的问题的人的作用将会增加。


ML 期待人类工作的六个经济因素


有许多非技术因素会影响 ML 对未来工作的影响。 具体而言,ML 对劳动力需求和工资的总体影响可以归类为六个不同经济因素:


1.替换


基于 ML 创建的计算机系统可以直接在某些工作中取代人类,降低任何给定的输出产量所需的人力。


2.价格弹性


通过机器学习实现自动化可以降低完成任务的成本, 这会导致总支增加或减少,取决于需求的价格弹性。 例如,如果弹性小于 -1,则价格下降导致购买数量的比例增加,总支出(价格乘以数量)将增加。 例如,随着技术在 1903 年以后降低了航空旅行的价格,这类旅行的总支出增加了,就业也随之增多。


3.互补性


任务 B 对于另一个自动化的任务 A 来说可能很重要,甚至是不可或缺。 随着 A 的价格下降,对 B 的需求将会增加。 通过类比,随着计算自动化的程度提高,对程序员的需求增加了。 技能也可以是其他技能的补充。 例如,人际交往能力与分析能力是一种互补关系。


4.收入弹性


自动化可能会改变人群的总收入。如果一个商品的收入弹性不为零,这又会改变对某些商品类型的需求,以及生产这些商品所需任务的需求。就像随着总收入的增加,美国人花在餐馆的钱也越来越多。


5.劳动力供给的弹性


随着工资的变化,从事该项工作的人数也会变化。 如果有许多人已经具备了必要的技能(例如驾驶汽车进行乘车服务),那么供给就具有相当的弹性,即使需求增加(或下降)很多,工资也不会上涨(或下降)很多。 相反,如果技能很难获得,比如成为数据科学家,那么需求的变化将主要体现在工资上而不是就业上。


6.重新设计业务流程


任何一组不同类型和数量的劳动力,资本和其他投入与产出联系起来的生产函数不是固定的。 企业家,管理人员和员工不断努力重塑相关流程。 当面对新技术时,他们将通过设计或机缘巧合改变了生产过程,并找到更有效的方法来进行产量。 这些变化可能需要一段时间,而且往往能够节约昂贵的投入,增加需求弹性。 同样,随着时间的推移,个人可以通过学习新技能或换新工作,来表示对于高工资的认可和回应,这样会增加相关的供给弹性。


结语


由于需要改变生产流程、组织设计、商业模式、供应链、法律甚至文化环境,所以技术的采用和推广往往需要几年或几十年的时间。这种互补性在现代企业和经济中是无处不在的,并且具有相当大的惯性,从而放慢实施新技术不乏。例如,将自动驾驶卡车整合到城市街道上可能需要改变交通法规,责任规则,保险等,因此需要在多个维度上进行补充性修改,应用需要更长的时间来影响经济和劳动力、法规、交通流量等,而将呼叫中心人员切换到虚拟助理可能只需要对业务过程或客户体验进行相对较少的重新设计。


随着时间的推移,另一个因素变得越来越重要:新商品,新服务,新任务和新流程会出现。 这导致全新的任务和工作,从而可以改变上述关系的程度和标志。 从历史上看,随着一些任务的自动化,释放的劳动力会重转移到新的商品或服务,进入到更有效的生产过程中。 这种创新比增加资本、劳动力或资源投入,更能提高总体收入和生活水平。 ML 系统可以通过自动化来加速符合上述标准的许多任务。


随着越来越多的数据进去线上并汇集起来,以及发现哪些任务应该由 ML 实现自动化,我们将更迅速地收集数据以创建更强大的系统。与我们以及掌握的解决方案不同,许多 ML 自动化任务的解决方案都几乎可以立即在全世界传播。我们可以期待未来的企业软件系统都将嵌入ML系统,自动化的成本将进一步降低。


近期监督学习系统的浪潮已经产生了相当大的经济影响。 ML 进一步发展,最终影响的范围和规模可能会超过或内燃机或电力等通用技术。 这些进步不仅直接提高了生产力,而且更重要的是,引发了机器、商业组织乃至整个经济的创新浪潮。 在技能,资源和基础设施等方面作出正确的互补性投资的个人、企业和社会得到了蓬勃发展,更好地理解每种类型 ML 的具体适用性及其对具体任务的影响,对于理解 ML 带来的经济影响至关重要。




致开发者:2018年AI技术趋势展望

2018-01-13                                         人工智能学家                     人工智能学家                    

人工智能学家                                                        

微信号AItists

功能介绍致力成为权威的人工智能科技媒体和前沿科技研究机构

                                                                       

【人工智能】未来三年(2018-2020),我们在新一代人工智能产业能做什么_第5张图片来源|公众号“AI 前线”,(ID:ai-front)

译者|核子可乐

编辑|Emily


概要:在 2018 年,开发者如何将一系列 AI 技术成果应用于当前的工作当中呢?


近日,一篇预测 2018 年 AI 技术趋势的文章,文中讨论了如何将 2017 年业界已经酝酿出一些成熟产物在在 2018 年实现大规模应用。在 2018 年,开发者如何将一系列 AI 技术成果应用于当前的工作当中呢?

今天的文章包括一份目前已经在实践中应用的 AI 算法与技术成果清单,如时序分析(深度学习正迅速取代信号处理领域中的一些传统技术)等。一方面,这些成果可以说相当酷炫,但本文暂时不会对强化学习的实际应用进行展望,因为在我看来,实际上其还很难在某些工业应用环境中产生实际效果。当然,不能否认的是,强化学习确实是个前景广阔,且正处于快速发展中的研究领域。这里我就不再继续讨论图像识别与简单的计算机视觉议题了,毕竟这几年此类文章已经多如牛毛:)


 GAN 与伪造


尽管生成性对抗网络已经拥有数年发展历史,但我对其仍抱有怀疑态度。几年过去,虽然如今的技术不再只能生成可怜的 64 x 64 图像,但这仍不足以打消我的顾虑。在阅读相关数学文章后,我对 GAN 并不能真正理解其分布状况的怀疑进一步加深。不过这一切在今年有所改变——首先是 CycleGAN 等有趣的体系以及 Wasserstein GAN 等数学改进让我得以在实践当中加以尝试。虽然其实际效果仍无法令人完全满意,但现在我已经确定,其生成能力绝对不容质疑。


首先,我强烈推荐英伟达公司发表的关于生成逼真全高清图像的研究论文(共结果要远好于一年之前恐怕的 64 x 64 面部图像):《AI 可以生成伪造的名人脸部图像,效果好得让人意外......》


https://www.theverge.com/2017/10/30/16569402/ai-generate-fake-faces-celebs-nvidia-gan


不过更让我激动的(甚至唤起了我的‘少年梦想’),则是利用 AI 生成伪造的色情影片:


《AI 生成的色情片》


https://motherboard.vice.com/en_us/article/gydydm/gal-gadot-fake-ai-porn


另外,游戏行业也在大规模采用这些新型技术,例如利用 GAN 生成景观、英雄甚至整个世界。在我看来,我们必须提高自己的分辨能力——从伪造的色情影片到欺诈性网络人物。


全部神经网络皆遵循同一独特格式


现代开发领域(不仅仅是在人工智能行业)的一大难题在于,我们往往面对数十种作用基本相同的框架方案。目前,每家投身于机器学习领域的大型企业都拥有自己的框架:谷歌、Facebook、Amazon、微软、英特尔、甚至包括索尼与优步都是如此,这还不算其它众多开源解决方案。在单一人工智能应用程序当中,我们往往需要使用多种不同框架——例如利用 Caffe2 实现计算机视觉,PyTorch 实现自然语言处理,TensorFlow/Keras 则专攻推荐系统。将这一切加以合并需要耗费大量时间,意味着数据科学家与软件开发人员需要费心费力,而无法专注于处理真正重要的任务。理想的解决方案应当是一种独特的神经网络格式,且可轻松与各类框架进行对接,包括允许开发人员轻松部署、确保科学家能够轻松使用。在这方面,ONNX 应运而生:


《ONNX:开源神经网络改变了格式》


http://onnx.ai/getting-started


可互换 AI 模型的新开源生态


事实上,ONNX 只是非循环计算图的一种简单格式,但却在实践层面为我们带来真正部署复杂 AI 解决方案的机会。我个人非常看好该项目——人们能够在 PyTorch 等框架当中开发神经网络并部署工具,而不再需要从头到尾始终被局限在 TensorFlow 生态系统之内。


 Zoo 快速普及


三年之前,人工智能领域最令人兴奋的成果当数 Caffe Zoo。当时我负责处理大量计算机视觉工作,因此需要尝试所有模型,并观察其工作原理以及实际效果。在此之后,我会利用这些模型进行迁移学习或者作为特征提取器。最近我开始使用两种不同的开源模型,并将引入规模更大的计算机视觉处理管道。究其本质,这意味着我们已经不再需要自行训练网络。举例来说,ImageNet 能够很好地实现对象或者地点识别,因此我们可以直接将这些基础性成果下载并接入到自己的系统当中。除了 Caffe Zoo 之外,其它框架也提供类似的 Zoo 方案。但真正让我惊奇的是,现在大家甚至能够将各类模型添加至计算机视觉、自然语言处理甚至是 iPhone 内的加速度计信号处理机制当中。


最全的核心机器学习模型列表(iOS 11 以上)


https://github.com/likedan/Awesome-CoreML-Models


在我看来,这类 Zoo 方案只会越来越多 ; 再加上 ONNX 这类生态系统的出现,这些方案将变得更加集中(并凭借机器学习区块链类应用实现本体分散)。


 AutoML 替换管道


设计一套神经网络架构无疑是一项痛苦的任务——有时候,大家可以通过叠加卷积层获得相当出色的结果,但在大多数情况下,我们需要利用直觉与超参数搜索等方法认真设计宽度、深度与超参数——例如随机搜索或贝叶斯优化。而且对于除计算机视觉以外的其它工作,我们不光需要对 ImageNet 上训练完成的 DenseNet 进行微调,同时也要面对 3D 数据分类或者多变量时序应用等其它难题。


目前已经存在多种能够利用其它神经网络从零开始生成新的神经网络架构的尝试,但其中我最为看好的,当数谷歌研究团队拿出的最新成果:


AutoML 用于大规模图像分类与对象检测


https://research.googleblog.com/2017/11/automl-for-large-scale-image.html


他们利用其生成计算机视觉模型,且不仅速度较人类科学家更快,效果也更好!我相信很快就会出现大量与之相关的论文与开源成果。在我看来,未来将有更多博文或初创企业不再强调“我们开发出一套 AI 方案……”,而是转向“我们的 AI 方案能够学习其它 AI 方案,并借此创造出新的 AI 方案”。至少我肯定会在自己的项目中加以尝试,请告诉不只我一个人有这样的冲动。


 智能堆栈规范化


关于这个概念,我的认知主要来自俄罗斯系统分析师、教练兼 AI 爱好者 Anatoly Levenchuk 的博客。通过以下图片,大家可以看到所谓“AI 堆栈”的示例:


【人工智能】未来三年(2018-2020),我们在新一代人工智能产业能做什么_第6张图片


其中不仅包含机器学习算法与您最喜爱的框架,同时也存在着诸多更为深入的层级,且各个层级都拥有自己的发展与研究趋向。


我认为人工智能开发行业已经非常成熟,其中存在着大量多元化的专家。事实上,团队中仅有一名数据科学家是远远不够的——大家需要不同的人才来进行硬件优化、神经网络研究、AI 编译器开发、解决方案优化以及生产实现。而在他们之上,还应设置不同的团队领导者、软件架构师(分别为各个问题进行堆栈设计)以及管理员。之所以在这里提及这个概念,是希望各位 AI 技术专家能够在职业规划当中予以关注——例如对于希望成为人工智能软件架构师或者技术领导者的朋友,您将能够借此确定自己需要学习哪些知识。


 语音类应用


人工智能能够以高于 95% 的精确度解决的问题其实非常有限:我们可以将图像归类为 100 种类别、可以判断文本内容属于正面还是负面,此外还有少数更为复杂的可行任务。展望新的一年,我认为最具突破的应用方向在于语音识别与生成。事实上,一年之前 DeepMind 发布的 WaveNet 已经拥有相当出色的表现,但现在感谢百度 DeepVoice 3 以及谷歌 Tacotron2 的助力,上述结论已经基本成为板上钉钉的事实:Tacotron 2: 立足文本生成逼真的人类语音


数十年以来,技术人员们一直在努力研究如何立足文本生成自然的人类语音(即文本到语音,简称 TTS 技术)……


https://research.googleblog.com/2017/12/tacotron-2-generating-human-like-speech.html


这项技术将很快拥有自己的开源版本(或者被其他一些技术天才所重现),意味着未来每个人都能够以极高的精度实现语音识别与生成。那么接下来的前景如何?毫无疑问,除了更出色的个人虚拟助手、自动阅读器以及对话转录工具之外,音频伪造也将成为现实。


 机器人智能水平略有提高


我们目前所拥有的机器人存在着一大共通性问题——其中 99% 根本不属于人工智能,而只是硬编码型方案。考虑到这样的情况,我们意识到已经不能简单利用数百万次对话训练编码器 - 解码器 LSTM,并指望能够借此建立起智能系统。正因为如此,Facebook Messenger 与 Telegram 中的大多数聊天机器人只能遵循硬编码命令,或者最多只能算是具备 LSTM 与 word2vec 语句分类能力的神经网络。现代先进自然语言处理技术的实际水平应该略高于此,Salesforce 公司做出的一些有趣实验已经证明了这一点:


AI 研究 - Salesforce.com


他们正在着手构建自然语言处理与数据库的接口,希望借此克服现代编码器 - 解码器自回归模型——即不仅能够对文字或句子进行嵌入,同时还可实现字符嵌入。此外,ROUGE 等自然语言评分优化机制等研究成果同样值得关注。


我相信通过上述开发工作,未来我们的聊天机器人至少能够获得更强大的智能信息检索与命名实体识别能力,并可能会在一部分封闭领域当中出现完全由深度学习技术驱动的机器人方案。


时序分析的当前发展水平


除了 Salesforce 之外,另一股遭受严重低估的机器学习研究力量当数优步 AI 实验室。前一段时间,他们曾发表一篇博文,其中展示了其时序预测方法。老实讲,这实在令我感到受宠若惊——因为其成果与我在应用当中使用的方法基本相同!下面来看这一将统计特征与深度学习表达加以结合的惊人示例:


优步公司利用递归神经网络预测极端性工程事件在优步公司,事件预测能力允许我们根据预期中的用户需求设计面向未来的服务方案。


https://eng.uber.com/neural-networks/


此外还出现了其它更激动人心的实例,包括利用 34 层 1 维 ResNet 诊断心律失常。最酷的是其拥有非常出色的成效——不仅远超多种传统统计模型,甚至在诊断率方面胜过了专业心脏病专家!算法诊断心律失常疾病,准确度超越心脏病专家|斯坦福新闻由斯坦福大学计算机科学家们发明的一种新算法能够对心律数据进行筛选……


https://news.stanford.edu/2017/07/06/algorithm-diagnoses-heart-arrhythmiascardiologist-level-accuracy/


我最近一直投身于深度学习的时序分析工作当中,并可以向大家保证神经网络在这方面确实表现良好。与传统的“黄金标准”相比,其成效可达到原有水平的 5 到 10 倍。


 优化应当获得更多关注


我们该如何对自己的神经网络进行训练?实事求是地讲,大多数从业者只是在使用“Adam()”以及标准学习率。也有一些聪明的从业者会选择最适合的优化器,同时调整并安排其学习速度。然而,大多数朋友对于优化这个主题仍然重视不足,因为我们习惯于直接按下“训练”按钮,并静待自己的神经网络收敛完成。但从计算能力、内存资源以及开源代码解决方案等层面来看,我们实际上基本处于公平的竞争环境当中——最终的赢家属于那些能够立足同一 Amazon 实例在最短时间内获得最佳 TensorFlow 模型成效的技术人员。从这个角度来看,决定一切的实际上正是优化。


2017 年深度学习优化大事记


目录:深度学习的终极目标在于找出最低程度的概括方法……


http://ruder.io/deep-learning-optimization-2017/index.html


在这里,我建议大家参阅 Sebastian 的 Ruder 博文,其中谈到了 2017 年内新近出现的、能够对标准优化器加以改进的简单方法,外加其它一些轻松易行的强化手段。


炒作态势有所降温


【人工智能】未来三年(2018-2020),我们在新一代人工智能产业能做什么_第7张图片


谈到这里,我们能够从以上图片当中得到怎样的启示?很明显,开发出有价值的新方案并借此获利绝非易事,特别是考虑到目前正有大量开源工具与算法被持续发布出来。我认为 2018 年对于 Prisma 这样的初创企业可能不会太友好——毕竟这个世界永远不缺少竞争对手与“技术天才”。他们完全可以将如今的开源网络部署在移动应用当中,并借此建立自己的商业企业。


在新的一年中,我们必须专注于更为基础的技术研发——而非一味追求快钱。即使大家只是打算利用谷歌 Ratacon 语音识别技术生成语音读物,也绝对不能仅仅将其视为简单的 Web 服务——相反,良好的合作伙伴与商业模式将成为您获得投资的必要前提。


总结


总结起来,我们目前已经拥有多种可以应用于实际产品的技术成果,具体包括时序分析、GAN、语音识别以及自然语言处理技术方面的改进等。我们不必再针对分类或者回归等目标自己设计基础架构,因为 AutoML 已经能够帮助我们完成这些任务,希望在经过进一步优化之后,AutoML 能够在速度方面更上一层楼。而在 ONNX 与模型 Zoo 的帮助下,我们将能够轻松将基础模型引入自己的应用程序当中。在我看来,至少就目前的最新发展水平而言,这将显著简化基于 AI 类应用程序的开发难度。



人工智能赛博物理操作系统

AI-CPS OS

人工智能赛博物理操作系统新一代技术+商业操作系统“AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利用AI-CPS OS形成数字化+智能化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生。


AI-CPS OS的真正价值并不来自构成技术或功能,而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务数据+分析一体化,这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合,没有颠覆现状的意愿,这些将不可能实现。


领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位:

  1. 重新行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?

  2. 重新构建企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?

  3. 重新打造自己:你需要成为怎样的人?要重塑自己并在数字化+智能化时代保有领先地位,你必须如何去做?

AI-CPS OS是数字化智能化创新平台,设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端,可以帮助企业将创新成果融入自身业务体系,实现各个前沿技术在云端的优势协同。AI-CPS OS形成的字化+智能化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置:

  1. 精细种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。

  2. 智能:模型随着时间(数据)的变化而变化,整个系统就具备了智能(自学习)的能力。

  3. 高效:企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力,这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。

  4. 不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。

  5. 边界模糊:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。

AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长:

  1. 创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;

  2. 对现有劳动力和实物资产进行有利的补充和提升,提高资本效率

  3. 人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间


给决策制定者和商业领袖的建议:

  1. 超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;

  2. 迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新

    评估未来的知识和技能类型;

  3. 制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开

    发过程中确定更加明晰的标准和最佳实践;

  4. 重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临

    较高失业风险的人群;

  5. 开发数字化+智能化企业所需新能力:员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。


子曰:“君子和而不同,小人同而不和。”  《论语·子路》云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。


如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!


新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。





产业智能官  AI-CPS



用“人工智能赛博物理操作系统新一代技术+商业操作系统“AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链




长按上方二维码关注微信公众号: AI-CPS,更多信息回复:


新技术“云计算”、“大数据”、“物联网”、“区块链”、“人工智能新产业:智能制造”、“智能农业”、“智能金融”、“智能零售”、“智能城市、“智能驾驶”新模式:“财富空间、“数据科学家”、“赛博物理”、“供应链金融”


官方网站:AI-CPS.NET


本文系“产业智能官”(公众号ID:AI-CPS)收集整理,转载请注明出处!



版权声明产业智能官(公众号ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:[email protected]





你可能感兴趣的:(【人工智能】未来三年(2018-2020),我们在新一代人工智能产业能做什么)