目录
A. 第四次产业革命:始于人工智能(6.7k字)
B. 人工智能将带来第四次产业革命(3.3k字)
C. 人工智能2.0时代序幕开启书(6.5k字)
D. 第四次产业革命之人工智能常识、机遇和挑战(4.8k字)
E. 数据简化DataSimp技术描述、学会及社区(1k字)
本文通过对第四次产业革命、人工智能概念常识、应用类型、产业智能化的概述,让大家认识到当今之趋势,以及人工智能细分领域和机遇所在。文末附秦陇纪10数据简化DataSimp技术描述、学会及社区。
A. 第四次产业革命:始于人工智能(6.7k字)
文章摘要:谷歌首席执行官桑达尔▪披猜去年底说「最近十年,我们一直在建立一个移动优先(mobile-first)的世界,而接下来的十年里,我们的将转向人工智能优先(AI-first)的世界。」原文作者:David Kelnar,译者:徐婧欣,标签:深度学习、机器学习、人工智能。
「最近十年,我们一直在建立一个移动优先(mobile-first)的世界,而接下来的十年里,我们的将转向人工智能优先(AI-first)的世界。」(Google CEO Sundar Pichai,2016年10月)
从Amazon和Facebook到Google和Microsoft,世界上最具影响力的技术公司的领导者都在表现出了对人工智能(AI)极大的热爱。那么什么是AI?为什么如此重要?为什么会在现在成为热点?虽然人们对于AI越来越感兴趣,但是只有专家才能真正能够理解这个领域。我们的目标是使更多人接触到这个重要领域。
首先我们要解释AI以及「机器学习」等关键术语的含义,阐述成果最丰富的AI领域「深度学习」是如何运作的,并对AI解决的问题及为什么这些问题很重要进行探索。我们还会分析,为什么二十世纪五十年代发明的AI技术会在今天迎来它的时代。
作为风险投资人,我们一直在寻找能够为客户和公司创造价值的新潮流。我们相信AI会是一种比移动化和云计算更重要的变革。Amazon的CEO Jeff Bezos表示,「很难说在接下来的20年,AI会对社会造成怎样的影响。」无论你是客户、行政人员、企业家还是投资人,我们希望这篇文章能够不同于那些天花乱坠的宣传,真正为你解释为什么这个新型潮流对我们来说如此重要。
一、什么是AI?
人工智能:关于智能程序的科学。
1956年,达特茅斯学院的助理教授John McCarthy创造了「人工智能」(AI)一词,指那些能够表现出智能行为的硬件和软件,用John McCarthy的话说,就是「制造智能机器,尤其是智能计算机程序的科学和工程。」
基础的「AI」已经存在了几十年,在特定环境下通过基于一定规则的程序呈现基本的智能行为。但是取得的成绩是有限的,因为用于处理很多现实世界问题的算法是很难人工进行编程的。
在进行医疗诊断、预测机器故障或是测定特定资产的市场价值等复杂活动时,会涉及到上千个数据组和变量之间的非线性关系。在这些情况下,我们很难用现有的数据得到「最佳」预测结果。而在其他领域,包括在图像中识别目标和语言翻译等,我们甚至无法创建规则来描述我们寻求的特征。我们怎么可能编写一组适用于所有情形的程序,来描述一只小狗的外貌呢?
进行数据优化和功能特征等复杂的预测时会遇到一些困难,假使我们将这种困难由程序员那里转移到程序呢?这就是现代人工智能的责任。
机器学习也属于AI技术,所有机器学习都属于AI,但AI并不只是机器学习(见表一)。从人们对AI的兴趣可以看出对机器学习的热情,这一领域的发展非常迅速并且意义重大。
有些问题对于人类来说非常复杂,而机器学习可以帮助我们将一部分负担转移给算法,来解决这些问题。1959年,AI的先驱Arthur Samuel曾经写道,机器学习是「一种赋予计算机无需明确编程就能学习的能力的研究领域」。
大部分机器学习的目标都是针对特定使用情况开发预测引擎。算法会接收到某一领域(比如一个人在过去看过的电影)的信息,对投入进行权衡,做出有用的预测(一个人在未来喜欢不同电影的可能性)。通过赋予「计算机学习的能力」,可以利用算法完成最优化的任务,最优化也就是通过衡量可用数据中的变量,对未来进行准确预测。我们还可以更进一步,将特征详述的任务也交给程序来做。
机器学习算法要经过训练。算法首先接收到例子,并且已知这些例子的输出,记录下预测输出与真实输出的差距并调整输入的权重提高预测的准确性,直到得出最优值。因此,机器学习算法最典型的特征就是,预测的质量会随着经验的丰富而提升。我们提供的数据越多(一定程度上),预测引擎能得出的结果就越优化。(见图二、图三,需要的数据集的规模非常依赖于环境,从以下例子中我们无法笼统概括。)
机器学习的方法有超过15种,每一种都使用不同算法结构,依据得到的数据实现预测最优化。「深度学习」是其中一种方法,在新的领域取得了突破性成果,我们将在下文中对此方法进行探索。此外一些没有受到很多关注的技术也很有价值,它们适用于更广泛的使用情形。除了深度学习外,「随机森林」也是一种最有效率的机器学习算法,可以创造很多决策树,使预测最优化;
「贝叶斯网络」使用概率性方法分析变量及各变量之间的关系;在支持向量机中输入的是类别化的案例,它可以创造模型,把新的输入分配到各个类别中。
每一种方法都有优势和不足,所以要结合起来使用(一种组合方法)。哪种算法会被选择出来解决某一特定问题,取决于可用数据集等因素的性质。实践中,开发者倾向于通过实验观察哪些算法是有效果的。
机器学习的使用案例根据我们的需求和想象而不同。拥有正确的数据后,我们可以建立算法实现各种目的:根据某人之前的购买记录推荐购买产品;预测汽车装配线上的机器何时会发生故障;预测电子邮件地址是否错误;估计信用卡交易欺诈行为的可能性;还有很多其他目的。
深度学习:将特征详述工作交给算法
即使使用随机森林、贝叶斯网络、支持向量机等普通机器学习方法,也很难编写出能很好地完成特定任务的程序,从理解语音到识别图像中的对象。因为我们无法以实际、可靠的途径来详述特征。例如,如果想要编写计算机程序来识别汽车的形象,我们无法在算法中详述汽车的特征,来确保在所有情况下都能准确识别。汽车的形状、大小和颜色多种多样,位置、方向和形态也有所不同。背景、灯光和很多其他因素都会影响对象的外表。一组规则中需要包含的变量太多了,即使我们能够全部包含进去,这种解决方案也不具备延展性。我们需要为每种需要识别的对象都编写一组程序。
深度学习(DL)已经彻底改变了人工智能世界。有超过15种实现机器学习的方法,深度学习就是其中一种,所有深度学习都属于机器学习,但是机器学习并不只是深度学习。(图4)
通过深度学习,程序员可以不必完成特征详述(根据数据定义需要分析的特征)或最优化(如何权衡数据以实现准确预测)的任务,而是全部交给算法来完成。
那么如何实现这些呢?深度学习的突破点在于模拟大脑,而不是模拟世界。我们的大脑会学习做有难度的事情,比如理解话语和识别物体,而且并不是通过详尽的规则而是通过时间和反馈来学习。小的时候我们体验这个世界(比如看见一张汽车的图片),做出预测(汽车!)然后收到反馈(没错!)。我们没有通过一组详尽的规则,而是通过训练进行学习。
深度学习使用的就是这种方法。将人造的、以软件为基础的计算器连接在一起,类似于大脑中的神经元。它们组成了一个「神经网络」,接收输入并进行分析、作出判断,如果判断正确,就做出通知,如果输出是错误的,算法就会对神经元之间的联系做出调整,改变未来的预测。最初网络会出现很多次错误,但随着我们输入数以百万计的例子,神经元之间的联系就会得到调整,最终几乎在所有情形下,神经网络都会做出正确的判断,这也就是熟能生巧。
通过这个过程,我们现在可以:
识别图片中的元素;
实时语言翻译;
语音控制设备(通过 Apple Siri、Google Now、Amazon Alexa 以及 Microsoft Cortana);
预测基因变化会对 DNA 转录产生怎样的影响;
分析客户反馈中的情感;
通过医学影像探测肿瘤。
深度学习并不能用于解决所有问题,其通常会需要利用大型数据集进行训练,需要广泛的处理能力来训练和运行神经网络。「可解释性」也是一个问题,要知道神经网络如何实现预测是非常困难的。但是深度学习使程序员从复杂的特征详述工作中解放出来,为一系列重要问题提供成功的预测机制。深度学习最终会成为AI开发者的强大工具。
二. 深度学习是如何工作的?
既然深度学习如此重要,了解其工作的基本要素也是非常有价值的。深度学习需要使用一个人工「神经网络」,即一组相互连接的「神经元」(基于软件的计算器)。
一个人工神经元至少会接收一个输入,其会以此为基础进行数学计算,得到输出结果。输出结果会依赖于每个输入的权重和神经元中的「输入-输出函数」的结构(图 5)。输入-输出函数会发生变化,神经元可能是:
一个线性单元(输出与总加权输入成一定比例);
一个阙值单元(输出可分为两个等级,根据总输入是否高于特定值确定其等级);或者 Sigmoid 单元(输出不断变化,与输入变化不成线性关系)。
当神经元相互连接时就会产生神经网络,一个神经元的输出会成为另一个神经元的输入(图 6)。
神经网络会组成多层神经元(所以会有「深度」学习)。「输入层(input layer)」接收信息,如一组图片,网络会对此进行处理。「输出层(output layer)」负责提供结果,多数活动都发生在输入层和输出层之间的「隐层(hidden layers)」上。神经网络上每一层的每个神经元的输出都是下一层的一个神经元的输入(图7)。
下面就以一个图像识别算法为例,在图像中识别人脸。将数据输入神经网络,由第一层来识别局部对比的模式等「低等级」特点,如轮廓。图像穿过网络后,会逐渐提取其中的「高等级」特点,从轮廓到鼻子,再到面部。(图8)
在输出层,通过训练神经网络会得出关于图片属于某一类的可能性(人脸:97%;气球:2%;树叶:1%)。
训练神经网络的方式就是将大量带有标记的例子展现在它们面前,可以检测出来错误,算法也会对神经元之间联系的权重进行调整,来完善结果。多次重复这个优化过程,就可以部署系统并对未标记的图像进行评估。
以上是一个简单的神经网络,但是结构可以变化,且多数比较复杂。变量包括同层神经元之间的连接;区别每层神经元的数量;神经元之间的联系向上一等级网络输出(递归神经网络)。
设计和完善神经网络需要大量的技能,步骤包括为特定应用组织网络、提供合适的训练数据集,根据进展调整网络结构,以及结合多种方法。
三.AI为什么很重要?
AI要处理的是非常有深度的难题,因此非常重要,这些问题的解决方案可以应用于那些对人类幸福感非常重要的部门,从健康、教育和商业到交通、公共事业和娱乐。二十世纪五十年代起,AI研究就关注了五个领域:
推理:通过逻辑推理解决问题的能力。
知识:表现关于世界知识的能力。(理解世界上的一些特定实体、事件和状况;具有某些特性的要素;可分类的要素。)
计划:制定和实现目标的能力(世界的未来有一种特定状态是我们所期待的,可以通过一系列的活动影响到通向这种状态的过程)。
交流:理解书面和口头语言的能力。
感知:根据视觉影像、声音和其他感官输入对与世界有关的事情进行推理的能力。
AI的价值可以体现在很多方面,这些能力的进步带来的不只是发展而是变革。AI的应用事例包括以下方面:
推理:法律评定;金融资产管理;财务应用处理;游戏;自主武器系统。
知识:医疗诊断;药品研发;媒体推荐;购买预测;金融市场贸易;欺诈防范。
计划:物流;行程安排;导航;物理和数字网络优化;预见性维护;需求预测;库存管理。
交流:声音控制;智能代理,助理及客户支持;书面及口头语言实时翻译;实时转录。
感知:自动驾驶;医疗诊断;监控。
接下来几年,几乎所有部门都会在更多流程中应用机器学习。比如简单的企业功能,如一家公司中的人力资源(HR),就即将应用机器学习;
员工招聘可以更有目标性,可以使用智能工作匹配和部分自动化评估功能;
通过人员需求和缺席的预测性计划可以强化员工管理;
如果能够推荐更适合员工的学习内容,员工学习也会更有效果;
通过对员工离职风险的预测可以减少人员变动。
机器学习将变得正规化,成为开发人员标准工具的一部分,能够完善并重塑现有流程。
机器学习的后续影响会超越即时影响。深度学习促进了计算机视觉的发展,例如可以实现车辆(轿车和卡车)自动驾驶。那么其又会带来哪些影响呢?目前在英国有 90% 的人和 80% 的货物是通过公路运输的,如果使用自动驾驶车辆会产生以下影响:
安全(90% 的交通事故是由驾驶员的疏忽引起的)
雇佣(英国有220万运输及物流行业的员工,年薪约为570亿英镑)
保险(Autonomous Research预计,之后英国的汽车保险费用将下降63%)
部门经济(客户将使用按需交通服务,代替自己的汽车);
汽车生产能力;城市计划;规则及其他。
四. 为什么现在会是AI的时代?
AI研究始于二十世纪五十年代,为什么在经历了多次失败以后,现在迎来了转折点?新算法的产生、数据通知能力的提升、更好的训练算法的硬件以及促使开发者使用AI技术的云服务。
1. 经过改进的算法
尽管深度学习并不是新技术,首个有效多层神经网络的详细说明发布于1965年,但是在过去十年里算法的发展确实对深度学习产生了很大影响。
由于卷积神经网络(CNN)的发展,我们在图像中识别物体的能力也得到了提高(图9)。受到动物视觉皮质的启发,神经网络中的每一层都是特定模式存在的过滤器。2015年,微软的基于 CNN 的计算机视觉系统(准确度:95.1%)在图片中识别物体的能力超过了人类(准确度:94.9%)。「据我们所知」,他写道,「我们的成果的表现首次超过了人类。」CNN 更加广泛的应用还包括视频和语音识别。
同时,递归神经网络(RNNs)出现后,语音和字迹的识别能力也在迅速提高(图10)。RNNs的反馈联系能够确保数据进入一个循环,这不同于只能正向输送的常规神经网络。有一种强大的新型RNN叫做「长短时记忆(LSTM)」模型。通过附加的联系和存储单元,RNN能够记忆几千个步骤之前看见的数据,并通知以下解释,这对于语音识别来说非常有价值,对下一个词的解释可以从前面的单词那里得知。2012年开始,Google 开始使用LSTM来支持Android系统中的语音识别,仅六周前,微软的工程师宣布,他们的系统误字率为5.9%,这是首次大致等同于人类的水平。
2. 专门化硬件
绘图处理器(GPUs)是专门的电子电路,极大削减了深度学习所需的训练神经网络的时间。
训练神经网络广泛应用了矩阵计算方法。所以对3D游戏有用的GPUs非常适合加速深度学习的发展,一个简单的GPU就能够将训练效率提升5倍,在较大的问题上,收获或许增加了不只10倍。如果结合上那些为了广泛使用深度学习框架而调整的软件开发装备,训练速度会有更大的提升。(图11)
3. 大规模数据
用于深度学习的神经网络通常都需要利用大型数据组进行训练,从几千个例子到几百万个例子。幸运的是,数据的创造和可用性在以指数方式增长。现在,随着进入数据的「第三次浪潮」,人类每天会产生2.2艾字节(23亿千兆字节)的数据;世界上所有数据中有90%都产生于过去的24个月。
数据创造的「第一次浪潮」开始于二十世纪八十年代,涵盖文档和交易数据,可以联网的台式PC的普及也加速了这次浪潮。接下来是数据的「第二次浪潮」,是非结构化媒体(电子邮件、照片、音乐和视频)的一次爆发,普及化的智能手机联网后会产生网页数据和元数据。现在我们正在迈入数据的「第三时代」,工业和家中都可以部署机器传感器,创造额外的监控、分析和元数据。
假定今天我们创造出的大量数据都是通过互联网传送的,膨胀的网络交通就会成为大量增长的数据量的防火墙。1992年,人类每天传送100GB的数据,而到了2020年,我们每秒就将传送61,000GB 数据(图12)。
我们能够使用的通用数据越来越多,专业数据资源加速了机器学习的进程。例如ImageNet,是一个可以自由使用的数据库,拥有超过一千万个带标签的图像。这个数据库加速了对象分类深度学习算法的发展。
4. 云服务
行业内顶尖的云计算供应商会提供云端的机器学习基础架构及服务,能够促进开发者对机器学习的使用。
Google、Amazon、Microsoft和IBM都会通过提供云端基础架构(建模和迭代环境、可扩展的「GPUs即服务」和相关托管服务)来降低开发机器学习功能的成本和难度。
此外,他们提供的云端机器学习服务(从图像识别到语言翻译)范围也在扩大,开发人员可以直接在自己的应用中使用这些服务。Google机器学习提供了一些很容易获得的服务,包括视觉(物体识别、明确内容检测、人脸检测和图像情感分析);语音(语音识别和语音文字转换);文本分析(实体识别、情感分析、语言检测及翻译);以及求职(列举工作机会以及资格匹配)。Microsoft Cognitive Services 能够提供超过21种视觉、语音、语言、知识和搜索领域的服务。
5. 利益和创业
在过去五年里AI领域的公共利益增长了六倍(图 13),风投公司对AI公司的投资也大幅增加(图14)。我们已经进入了一个良性循环,机器学习领域的进步正在吸引投资、创业以及注意力。而后者又会反过来加速机器学习的发展。
五. 前景如何?
机器学习能带来的利益是无穷的,我能够看到的就包括从无人驾驶汽车到人机互动的新途径。还有很多利益没有这么明显,但是能够提供日常的业务流程和客户服务的能力和效率。
有时我们的期望过高,超出了短期的发展潜力,我们希望未来能够真正认识AI,随着机器学习被用于改善和重新设想现有的系统,希望我们能够认识到AI的价值。
历史上,产业革命会通过新的能量来源和传动装置改变生产和交流方式。18世纪80年代,第一次产业革命通过蒸汽动力实现了生产自动化。19世纪70年代,第二次产业革命通过电力实现了大量生产。20世纪70年代以来,第三次产业革命通过电子工业和软件技术实现了生产及通讯的自动化。现在,软件遍布整个世界,信息处理成为了价值创造的首要来源。机器学习使我们的世界更加智能化,将产生历史性的利益。
B. 人工智能将带来第四次产业革命(3.3k字)
(本文来源:网易科技报道2016-04-28 15:27:49,责任:丁钰明_NT2591,网址http://tech.163.com/16/0428/15)
网易科技讯2016年4月28日消息,一年一度的GMIC大会于今日开幕,在下午的全球智能机器人大会上,地平线机器人技术创始人兼CEO余凯发表了开场演讲,认为人工智能将成就第四次产业革命。余凯称人工智能将成为世界上的新物种,人类花3到6个月可以学到的技能,在未来5到10年都会被人工智能取代。
余凯称,过去人类所有的进展实际上都是以人为中心,包括用技术去延展你的体力、脑里,使人走得更快,看得更远。但是今天AlphaGo是跟你下棋,它是自主做决策,是一个自助行为的实体。所以说,像AlphaGo这样的人工智能是一个新的物种,它的一个核心特征就是这种自主决策的行为。
另外,人工智能也会逐步替代人的一些简单的工作。在取代人类工作方面,余凯认为如果是一个人大概花3个月到6个月的时间能够学习到的技能,在未来5到10年的时间都会被机器所替代,比如说驾驶。
余凯认为,大脑系统是未来机器的关键,它需要有感知的能力,需要有认知的能力,需要有决策的能力,这些核心离不开的是算法。在一个深度学习的算法框架下面,我们看到很多人工智能的能力,机器所具备的能力,在过去的十年来都发生着翻天覆地的变化,从语音到图像,甚至到决策的控制,包括语意的理解。余凯称,宇宙中最聪明的智能设备是人类的大脑,如果从机器的角度想去实现这样一个能力,你会看大脑是什么样子,从基本的神经原到感知肌,到更加复杂的网络结构,到我们今天深度的神经网络。目前,人类已经在深度学习上取得了很大的进展。(小羿)以下为演讲实录:
余凯:大家下午好!我们很多人说这次可能是一个新的产业革命,第四次产业革命,从蒸汽机时代到电器时代到信息时代,我们这次是人工智能时代。为什么说这是一次新的产业革命呢?我们觉得回顾过去十几年的历史,从PC互联网到移动互联网,到我们现在比如说我们叫AR、VR的时代,我们看到很多的信息、内容、服务,包括物理世界所存在的这些实体,比如说嘀嘀打车把每个出租车什么司机,是哪个车号,现在在哪个地方,往哪个地方走都线上化了。所谓物理世界和虚拟世界的界限也比较的虚化了。
比如说我们思考阿尔法狗(AlphaGo)这件事情,它跟我们以前技术的进展很大的不一样是说,过去所有的进展实际上都是以人为中心,去延展你的体力、脑里,使你走得更快,看得更远。但是今天阿尔法狗是跟你下棋,它是自主做决策,这样一个自助行为的实体。这样的话是一个新的物种,它的一个核心特征就是这种自助决策的行为。它会在生活、生产很多的方面,它在逐步替代人的一些简单的工作。比如说我们会看到,如果是一个人大概花3个月到6个月的时间能够学习到的技能,这样的技能在未来5到10年的时间都会被机器所替代,比如说驾驶,过去可能少数人具有一个专车司机,未来每个人都会等效的有一个专车司机,因为每一个车在15年到20年的时间里面应都是自动驾驶的。
我们把Robot翻译成机器人,你在这个机器后面承载的一个人的概念,这个概念它实际上跟Robot的本意有可能不一样。比如说我们查剑桥的辞典,我们查Robot这个词讲的是什么意思?讲的是它可以自动完成一定任务计算机控制下面的机器。所以Robot讲的是智能机器,它跟人这个词并没有一个必然的关联。
我们想有没有机器人这样一个词?其实是有的,我相信在座的各位用的是手机的操作系统是安卓的,我们查安卓这个词,意思是长得像人的Robot。安卓是一个人形机器人,它实际上在一个很宽泛概念里面非常小的一个例子,但是在更宽广的语境下面讲的是智能机器,智能机器当然有各种各样的多样化的。在中国的语境下面有的时候你会问这样一个问题,这个是Robot?这个它当然是一个机器人,它可以自助的跟你交互。长城会的兄弟们放了一个机器人在我们公司调戏了它一个礼拜,如果你在它周围走动的时候,它眼睛会一直看着你,跟着产生很有意思的互动。它显然是机器人,它也是Robot。
我问大家这个问题,这个是不是一个Robot?这个是不是一个安卓的?我记得日本的石黑浩教授每年都会来我们这个会场,至少一次,带着他的美女机器人,我们很多的记者也会去报道,说日本的机器人技术怎么样怎么样了。我在这里面想澄清一点,就是我们有一些媒体记者需要他们的知识,如果你稍微了解一下,实际上在台的后面的某一个小房间里面,有一个小女生坐在电脑面前,它实际上所有的交互都是这个小女生来控制的。它的语音识别,甚至它的反馈,都是后面的小女生来完成的。所以这样的一个形态的东西,它完完全全是一个木偶。
这些机器人它没有人的形状,但是它们能和你交互,可能成为你生活中的陪伴,或者是家庭里面的一个中控。这样一个智能交互的设备它当然是Robot,但是它不是安卓的。
我们看这些玩具,这些所有的品类在生活中无处不在它们今天只是我们叫功能型,但是未来它应该是变成它们装上传感器,配上算法,有控制系统,它可以自助的行为决策。未来所有这些品类,它们都会变成Robot,都会变成无处不在的自助的机器。所以这是一个大的趋势。在移动互联网以后,比移动互联网更大的未来,是无处不在的万物互联,无处不在的万物智能。所以AI Inside它将无处不在。
这样两个图像放在一起,你们有什么感想?在几个星期前有一个新闻,当然全世界都在关注,就是关于阿尔法狗,在那个礼拜关于同一家公司谷歌有另外一个新闻,在座的各位可能也关注到了,谷歌在考虑把他们的一个公司给卖掉,谷歌为什么会做出这样的选择?我们比较这两个图像,另外一边是人类的近亲,它的谷歌,它的肌肉,它更强大,更灵活,但是它还在丛林里面找香蕉吃。人类已经征服太空。人类有非凡的大脑,使人类变得卓越,变得不同。
大脑的系统无疑是未来Robot的关键,它需要有感知的能力,需要有认知的能力,需要有决策的能力。这些核心实际上离不开的是算法。在一个深度学习的算法框架下面,我们看到很多人工智能的能力,机器所具备的能力,在过去的十年来都发生着翻天覆地的变化,从语音到图像,甚至到决策的控制,包括语意的理解。宇宙中最聪明的智能设备是人类的大脑,如果从机器的角度想去实现这样一个能力,你会看大脑是什么样子,从基本的神经原到感知肌,到更加复杂的网络结构,到我们今天深度的神经网络。
深度学习的算法和传统的AI的算法一个很大的不同,AI的算法到了数据大到一定程度的时候,不一定效果不断的变好,但是深度神经网络的算法,你可以看到它不断的提升。比如手阿尔法狗它产生数千万盘棋局的数据,通过它不断的学习深度神经网络,从职业的二段也不知道到职业的多少段,据说是职业13段这样的水平,它的水平在不断的提高,这就是大数据和深度结合所带来的变化。
我们看到因为深度学习的发展,过去在图像领域,在语音领域所引领的,不断去突破它的极限,使它的识别错误率不断的降低。这是语音识别深度神经网络代替深学模型。后来端到端的学习带来语音识别率继续的提升。这是我们看到最近在端到端的深度神经网络在语意的处理和理解上面所取得的进展。
我们最近看到,前面我们看到很多感知方面的进展,从阿尔法狗我们看到,从感知到行为决策,深度学习,进入后一个十年发展的趋势,如果你只是感知,不做任何决策,其实你并不改变这个世界,只有在环境中不断的做决策,去调整,去优化你长期的收益,这个机器才能变成自主行为,并且改变世界的技术。
同样的技术不光是在棋的对局,自动驾驶可以看作是汽车和环境的博弈。这样一个博弈你在每时每刻在连续的做决策,比如说你是加速,你是左还是右,因为你每一次决策,你周围的环境会发生改变,这些你需要连续做决策,最后优化的是一个长期的收益,就是从A地到B地足够的高效,足够的安全。
未来机器人大脑的构架,一种想法完全在云端处理,但是这样会带来问题,比如一个汽车在行使过程中突然有小孩横穿马路,你把数据传导云端,云端处理来回来,如果这个网络不稳定怎么办?说到这种实现和处理,我们自然会想到用什么树立起。我们手机和电脑上都有CPU,我们刚才讲的无处不在的人工智能所需要的这些感知、认知和控制,它需要这些东西是些专用的处理器。你会问,你这个问题有点奇怪,人类的大脑看起来是一个通用的处理器,在座的各位我不知道多少会认为大脑是通用还是专用处理器?认为大脑是通用处理器的举个手?是专用处理器的举个手?就更少了。
C. 人工智能2.0时代序幕开启书(6.5k字)
中国工程院院刊:人工智能2.0时代序幕开启
中国科学技术部“科技创新2030—重大项目”近期或将新增“人工智能2.0”,人工智能将进一步上升为国家战略。近日,中国工程院院刊信息与电子工程学部分刊《信息与电子工程前沿(英文)》出版了“Artificial Intelligence 2.0”专题,潘云鹤、李未、高文、郑南宁、吴澄、李伯虎、陈纯等多位院士以及专家学者参与撰文,对人工智能2.0中所涉及的大数据智能、群体智能、跨媒体智能、混合增强智能和自主智能等进行了深度阐述。(2017-02-21新智元)
中国“科技创新2030重大项目”将新增“人工智能2.0”
根据中新网的报道,中国科学技术部“科技创新2030—重大项目”目前已启动4个试点,近期或将新增“人工智能2.0”。
2016年国务院印发《“十三五”国家科技创新规划》提出“面向2030年,再选择一批体现国家战略意图的重大科技项目”。经过千余名专家多轮论证,最终形成15个项目立项建议。
“按照‘成熟一项、启动一项’原则,分批启动。”中国科技部副部长阴和俊说,现已全面启动量子通信和量子计算机、脑科学与类脑研究、深海空间站及天体一体化信息网络4个项目的实施方案编制,力争在2017年底前编制完成全部实施方案。
阴和俊说,结合当前人工智能迅速发展的态势,计划在已有的15个项目的基础上新增“人工智能2.0”,目前已进入实施方案的最终论证阶段。
中国科技部高新技术发展及产业化司司长秦勇说,高新技术发展及产业化水平直接关系到国家科技竞争力和产业核心竞争力。在科技创新2030—重大项目“15+1”中,有10项涉及高新领域,分别是:航空发动机及燃气轮机、国家网络安全空间、深空探测及空间飞行器在轨服务与维护系统、煤炭清洁高效利用、智能电网、天地一体化信息网络、大数据、智能制造和机器人、重点新材料研发及应用,以及正在酝酿的“人工智能2.0”。
秦勇说,“十三五”时期面临着国际科技竞争的严峻挑战和经济新常态对科技创新的迫切需求,中国对能源、信息、空天、制造、交通、材料、现代服务业等高新领域编制专项发展规划,并将建设一批科技创新国家战略平台,其中包括启动建设国家实验室和布局一批国家技术创新中心。
中国人工智能2.0时代序幕开启
“人工智能”这一概念提出后,迅速发展成为一门广受关注的交叉和前沿学科,沿着“从符号主义走向连接主义”和“从逻辑走向知识”两个方向蓬勃发展,在象棋博弈、机器证明和专家系统等方面取得了丰富成果。随着互联网的普及、传感网的渗透、大数据的涌现、信息社区的崛起,数据和信息在人类社会、物理空间和信息空间之间的交叉融合与相互作用,大众创业和万众创新等新技术、新产业和新业态不断涌现,使得对人工智能基本理论和方法的研究开始出现新的变化,这些变化也使得人工智能新的应用呈现勃勃生机。
为了更好地与学术同行交流人工智能2.0理论、方法和技术,潘云鹤院士于2016年12月在中国工程院院刊Engineering(主刊)发表了题为“Heading toward artificial intelligence 2.0”的论文,从人工智能60年的发展历史出发,通过分析促成人工智能2.0形成的外部环境与目标的转变,分析技术萌芽,提出了人工智能2.0的核心理念,并结合中国发展的社会需求与信息环境特色,给出了发展人工智能2.0的建议。
2017年1~2月,中国工程院院刊信息与电子工程学部分刊Frontiers of Information Technology & Electronic Engineering(《信息与电子工程前沿(英文)》出版了“Artificial Intelligence 2.0”专题,潘云鹤院士撰写了社论“Special issue on artificial intelligence 2.0”。该专题分为六大方向,每个方向均有院士领衔,对人工智能2.0中所涉及的大数据智能、群体智能、跨媒体智能、混合增强智能和自主智能等进行了阐述。
下面对专题中的7篇综述类论文进行导读。
1.《挑战与希望:AI2.0时代从大数据到知识》
作者:庄越挺、吴飞、陈纯、潘云鹤
对大数据时代人工智能领域近期出现的若干理论和技术进展进行了综述,认为将数据驱动机器学习方法与人类的常识先验与隐式直觉有效结合,可以实现可解释、更鲁棒和更通用的人工智能。AI2.0时代大数据人工智能具体表现为:从浅层计算到深度神经推理;从单纯依赖于数据驱动的模型到数据驱动与知识引导相结合学习;从领域任务驱动智能到更为通用条件下的强人工智能(从经验中学习)。下一代人工智能(AI2.0)将改变计算本身,将大数据转变为知识,以支持人类社会更好决策。
文章配图:从数据到知识
2.《AI2.0时代的群体智能》
作者:李未、吴文峻、王怀民、程学旗、陈华钧、周志华、丁嵘
认为基于互联网的信息物理世界深刻地改变了人工智能发展的信息环境,将人工智能研究的新浪潮推进到人工智能2.0新纪元。作为AI2.0时代最突出的研究特点之一,群体智能引起了产业界和学术界的广泛关注。具体来说,为应对挑战,群体智能提供了一种通过聚集群体的智慧解决问题的新模式。特别是由于共享经济的快速发展,群体智能不仅成为了解决科学难题的新途径,而且也已融入日常生活的各个方面,例如线上到线下(online-to-offline, O2O)应用、实时交通监控、物流管理。该文对现有群体智能研究成果进行总结和综述。首先,论述了群体智能的基本概念,并对其与现有相关概念(如众包和人本计算)的关系进行了解释。然后,介绍了4类具有代表性的群体智能平台,总结了3项核心问题以及最新的群体智能技术。最后,讨论了群体智能研究的发展方向。
文章配图:参与式和移动人群感知
3.《跨媒体分析与推理:研究进展与发展方向》
作者:彭宇新、朱文武、赵耀、徐常胜、黄庆明、卢汉清、郑庆华、黄铁军、高文
认为随着人类文明的进步以及科技的发展,信息的传播从文字、图像、音频、视频等单一媒体形态逐步过渡到相互融合的多种媒体形态,越来越显现跨媒体特性,而如何实现跨媒体分析与推理就成为了研究和应用的关键问题。本文从7个方面对跨媒体分析与推理进行综述:(1)跨媒体统一表征理论与模型;(2)跨媒体关联理解与深度挖掘;(3)跨媒体知识图谱构建与学习方法;(4)跨媒体知识演化与推理;(5)跨媒体描述与生成;(6)跨媒体智能引擎;(7)跨媒体智能应用。
文章配图:多模态数据统一表征方法示例
4.《混合—增强智能:协作与认知》
作者:郑南宁、刘子熠、任鹏举、马永强、陈仕韬、余思雨、薛建儒、陈霸东、王飞跃
认为由于人类面临的许多问题具有不确定性、脆弱性和开放性,任何智能程度的机器都无法完全取代人类,这就需要将人的作用或人的认知模型引入到人工智能系统中,形成混合—增强智能的形态,这种形态是人工智能或机器智能的可行的、重要的成长模式。混合—增强智能可以分为两类基本形式:一类是人在回路的人机协同混合增强智能,另一类是将认知模型嵌入机器学习系统中,形成基于认知计算的混合智能。该文讨论人机协同的混合—增强智能的基本框架,以及基于认知计算的混合—增强智能的基本要素——直觉推理与因果模型、记忆和知识演化;特别论述了直觉推理在复杂问题求解中的作用和基本原理,以及基于记忆与推理的视觉场景理解的认知学习网络;阐述了竞争—对抗式认知学习方法,并讨论了其在自动驾驶方面的应用;最后给出混合—增强智能在相关领域的典型应用。
文章配图:人在回路的混合增强智能
文章配图:知觉推理与认知映射的关系
文章配图:企业协作决策的混合增强智能的一般框架
5.《AI2.0时代的类人与超人感知:研究综述与趋势展望》
作者:田永鸿、陈熙霖、熊红凯、李洪亮、戴礼荣、陈婧、兴军亮、陈靖、吴玺宏、胡卫明、胡郁、黄铁军、高文
简要回顾了不同智能感知领域的研究现状,包括视觉感知、听觉感知、言语感知、感知信息处理与学习引擎等方面。在此基础上,对即将到来的AI2.0时代智能感知领域需要大力研究发展的重点方向进行了展望,包括:(1)类人和超人的主动视觉;(2)自然声学场景的听知觉感知;(3)自然交互环境的言语感知及计算;(4)面向媒体感知的自主学习;(5)大规模感知信息处理与学习引擎;(6)城市全维度智能感知推理引擎。
文章配图:AI2.0 时代智能感知技术框架
6.《智能无人自主系统发展趋势》
作者:张涛、李清、张长水、梁华为、李平、王田苗、李硕、朱云龙、吴澄
介绍了智能无人自主系统的发展趋势,将相关技术分成了7个领域,包括人工智能技术、无人车、无人机、服务机器人、空间机器人、海洋机器人和无人车间/智能工厂,对每个领域的发展趋势进行了介绍。
文章配图:无人机发展趋势预测
7.《人工智能在智能制造领域的应用研究》
作者:李伯虎、侯宝存、于文涛、陆小兵、杨春伟
介绍了团队近年将人工智能技术应用于制造领域的研究与实践。首先,简析“互联网+人工智能”时代核心技术飞速发展正引发制造领域的模式、手段和生态系统的重大变革以及人工智能的新发展;接着,基于人工智能技术与信息通信技术、制造技术及产品有关专业技术等融合,研究提出了智能制造新模式、新手段、新业态,智能制造系统体系架构和智能制造系统技术体系;进而,从智能制造的应用技术、产业和应用示范等角度, 简述智能制造领域的国内外发展现状;最后,提出我国人工智能2.0在智能制造领域应用研究的建议。
文章配图:智能制造新模型、手段、业态示意图
以上文章下载阅读地址:http://www.zju.edu.cn/jzus/issue.php?issueid=480
潘云鹤院士:人工智能迈向 2.0
中国工程院院士、中国工程院原常务副院长潘云鹤院士2016年12月在中国工程院院刊Engineering(主刊)发表了题为“Heading toward artificial intelligence 2.0”的论文,提出了人工智能 2.0的核心理念,以下是文章全文,转自科学网:
近年来,人们对人工智能(artificial intelligence,简称AI)产生浓厚兴趣,产业界首先布局。大量资本与并购的涌入加速了AI技术与应用的结合,并蔓延升温。据美国CBInsight公司2016年7月报告,2011年至今,谷歌、微软、Twitter、Intel、Apple等IT巨头收购了约140家AI领域的创业公司。仅2016年上半年,资本市场对AI投入已超2015年全年。
谷歌2014年高价收购 DeepMind 公司,2016年研制的AlphaGo战胜了围棋世界冠军,2017年初又60连胜,谷歌自称正从一个“移动优先”转向“AI优先”的公司。微软小冰聊天机器人,正引导从传统的“图形界面”向“自然语言和情感理解交互界面”转变;IBM开发Watson系统已进入医院,正在改变肿瘤临床诊断与治疗的运作模式;百度公司因在机器翻译、自然语言理解和智能汽车的布局,被评誉“最聪明的公司”……这些进步预示着AI技术将有大的飞跃。
1956年,美国学者首次提出“AI”概念,即:让机器能像人那样理解、思考和学习,即用计算机模拟人的智能。传统AI典型研究的领域是:机器定理证明、机器翻译、专家系统、博弈、模式识别、机器学习、机器人与智能控制等,逐步形成符号、连接、行为等学派。
AI进步的动力不仅来自于内部驱动,更来自于信息环境与社会需求等外部驱动。
随着移动终端、互联网、传感器网、车联网、穿戴设备等的流行,感知设备遍布全球,计算与人类密切相伴,网络连接着个体和群体,快速反映与聚集他们的发现、需求、创意、知识和能力。同时,世界已从二元空间结构(物理, 人类社会)演变为三元空间结构(信息网络, 物理, 人类社会),它们之间的互动将形成各种新计算,包括感知融合、“人在回路中”、增强现实(AR)、跨媒体计算等等。
智能化的需求牵引,使AI在城市、医疗、交通、物流、机器人、无人驾驶、手机、游戏、制造、社会、经济等发展中成为新技术、新目标,很多企业和城市已进行AI布局。
从过去追求“用计算机模拟AI”,转化为:用机器与人结合成增强的混合智能系统;用机器、人、网络结合成新的群智系统;用人、机器、网络和物结合成的智能城市等更复杂的智能系统。
AI基本方法是数据驱动的算法,今后将涌现出大数据、传感器、网络、跨媒体等驱动计算,从而使大数据、感知融合、跨媒体等智能发展成为必然,传统以字符为基础的机器智能测试图灵方法将受到挑战。
当前,若干新技术变化已初露端倪,成为AI迈向2.0的技术萌芽。
以 DeepMind 的 AlphaGo 技术为例,其深度强化学习发展了“直觉感知(下一步在哪)”、“棋局推理(全局获胜机会如何)”和“新颖落子(想人所不敢想)”等能力,并将记忆人类棋局和自我博弈积累棋局结合了起来。目前,该深度学习技术的缺陷是不可解释,不通用,需要大数据智能的发展来解决。
事实上,大规模个体通过互联网参与和交互,可实现超乎寻常的智慧能力。如,普林斯顿大学Connectome项目开发的EyeWire游戏,玩家可对显微图像中单个细胞及其神经元连接按功能进行涂色,145个国家的165000多名科学家及志愿者参与,首次详述了哺乳动物视网膜神经组织如何检测运动的结构功能关系等。群智计算能将极大提高人类社会的智能水平,用途广,其理论和技术尚处原始阶段。
2008年,中国科学家率先提出了“跨媒体计算”概念。2010年,《Nature》发文指出,文本、图像、语音、视频及其交互属性将紧密混合一体,即为“跨媒体”。跨媒体智能是机器认知外界环境的基础,对语言、视觉、图形和听觉的语义贯通是实现联想、设计、概括、创造等智能行为的关键。当前,其尚处发展萌芽状态,可望形成新一代AI的重要领域。
用计算机来模拟人的智能固然重要,而让计算机与人协同,取长补短而成为一种“1+1>2”的增强性智能系统则更为重要。当前,各种穿戴设备、智能驾驶、外骨骼设备、人机协同手术等纷纷出现,而宏观系统的人机协同有更大空间,预示着人机协同增强智能系统的前景广泛。
AI诞生之际,机器人被列入其目标领域,仿生学也成为重要发展方向。但大多数案例表明,对原有机械装备进行智能化和自主化升级,要比类人机器人更高效。因此,自主智能系统将成为新一代AI的重要方向,也对制造业升级尤为重要。
综上所述,我们给出的AI2.0初步定义是:基于重大变化的信息新环境和发展新目标的新一代人工智能。其中,信息新环境是指:互联网与移动终端的普及、传感网的渗透、大数据的涌现和网上社区的兴起等等。新目标是指:智能城市、智能经济、智能制造、智能医疗、智能家居、智能驾驶等从宏观到微观的智能化新需求。可望升级的新技术有:大数据智能、跨媒体智能、自主智能、人机混合增强智能和群体智能等。
AI2.0的技术特征表现在:一是从传统知识表达技术到大数据驱动知识学习,转向大数据驱动和知识指导相结合的方式,其中机器学习不但可自动,还可解释,更广泛;二是从分类型处理多媒体数据 (如视觉、听觉、文字等),迈向跨媒体认知、学习和推理的新水平;三是从追求“智能机器”到高水平的人机协同融合,走向混合型增强智能的新计算形态;四是从聚焦研究“个体智能”到基于互联网络的群体智能,形成在网上激发组织群体智能的技术与平台;五是将研究的理念从机器人转向更加广阔的智能自主系统,从而促进改造各种机械、装备和产品,走上智能化之路。
相比以往,AI2.0将不但以更接近人类智能的形态存在,而且以提高人类智力活动能力为主要目标,将紧密融入我们的生活(跨媒体和无人系统),甚至扩展为我们身体一部分(混合增强智能),可以阅读、管理、重组人类知识(大数据智能与群体智能),为生活、生产、资源、环境等社会发展问题提出建议,在越来越多的专门领域的博弈、识别、控制、预测中接近甚至超越人的能力。
中国正值工业化、城镇化、信息化、农业现代化和绿色化发展高潮,急需AI发展不断改善人民生活,提高社会生产力,优化城镇的发展、提高资源利用水平,促进教育、医疗、贫困、环境、资源等紧迫问题的解决。
建议我国布局实施AI2.0时,一是要与重大需求和已积累的发展成果相结合,如电子政务、电子商务、快递物流、智能社区、分享经济、智能手机、电视家电、制造业升级,和创新设计、跨媒体计算、图像编码、中文识别、知识中心、智能城市及大数据等先行理念或技术成果;二是研究内容要围绕大数据智能、互联网群体智能、跨媒体智能、人机混合增强智能、自主智能系统等新一代方向;三是中国要推动和全球各国科学家与智库开展合作,推动人工智能技术能沿着服务人类的正确方向升级。
致谢
感谢徐匡迪和周济院长,没有他们的帮助,本文不可能在今天完成。感谢李未、高文、郑南宁、吴澄、李伯虎、陈左宁、陈纯等院士和庄越挺教授,很多概念是在与他们的讨论中才得以完善。感谢李仁涵、吴飞、汤斯亮教授,他们为本文的形成提供了很多重要的资料。
全文资料来源:
1. Pan YH. Heading toward artificial intelligence 2.0. http://engineering.org.cn/EN/abstract/abstract12324.shtml
2. Special Issue on Artificial Intelligence 2.0. http://www.zju.edu.cn/jzus/issue.php?issueid=480; http://link.springer.com/journal/11714/18/1/page/1
3. Special Feature on Artificial Intelligence 2.0. http://www.zju.edu.cn/jzus/issue.php?issueid=483; http://link.springer.com/article/10.1631/FITEE.1700053
4.中国“科技创新2030—重大项目”将新增“人工智能2.0” http://www.most.gov.cn/xinwzx/mtjj/ztjj/201702/t20170216_130982.htm
5.http://news.sciencenet.cn/htmlnews/2017/1/365934.shtm
D. 第四次产业革命之人工智能常识、机遇和挑战(4.8k字)
1、人工智能概念和价值
人工智能(Artificial Intelligence)英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。1956年夏季,麦卡赛、明斯基、罗切斯特和申农等年轻科学家在美国DARTMOUTH学会共同研究和探讨用机器模拟智能的问题,首次提出“人工智能”这一术语,名称来源于雨果·德·加里斯的著作。
人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,“人工系统”就是通常意义下的人工系统。“智能”涉及到诸如意识(CONSCIOUSNESS)、自我(SELF)、思维(MIND)(包括无意识的思维(UNCONSCIOUS_MIND))等问题。尼尔逊教授“人工智能是关于知识的学科――怎样表示知识以及怎样获得知识并使用知识的科学。”另一个美国麻省理工学院温斯顿教授“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”这些说法反映了人工智能学科的基本思想和基本内容,即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。
人工智能科学极富挑战性,研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,人工智能是一门边沿学科,属于自然科学、社会科学、技术科学三向交叉学科。AI涉及学科:哲学和认知科学,数学,神经生理学,心理学,计算机科学,信息论,语言学、控制论,不定性论、仿生学,社会结构学与科学发展观等十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等。其研究范畴:自然语言处理,知识表现,智能搜索,推理,规划,机器学习,知识获取,组合调度问题,感知问题,模式识别,逻辑程序设计软计算,不精确和不确定的管理,人工生命,神经网络,复杂系统,遗传算法等。
人工智能研究目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。[1] AI是计算机学科分支,称为二十世纪七十年代世界三大尖端技术(空间技术、能源技术、人工智能),二十一世纪三大尖端技术(基因工程、纳米科学、人工智能)之一。近三十年来,AI迅速发展,在很多学科领域都获得了广泛应用和丰硕成果,已逐步成为一个独立分支,在理论和实践自成一个系统。我国AI已经上升为和计算机科技、软件工程并列的一级学科,在计算机领域、在机器人、经济政治决策、控制系统、仿真系统中得到应用。
2、人工智能科学发展阶段
1956年,在美国达特茅斯(Dartmouth)学院,约翰·麦卡锡(John McCarthy,1971年度图灵奖获得者)、马文·李·闵斯基(Marvin Lee Minsky,1969年度图灵奖获得者)、克劳德·艾尔伍德·香农(Claude Elwood Shannon,信息理论之父)、纳撒尼尔·罗彻斯特(Nathaniel Rochester,IBM第一代通用计算机701主设计师)四位学者发起举行“人工智能夏季研讨会”,指出“人工智能”研究目标是实现能模拟人类的机器,该机器能使用语言,具有概念抽象和理解能力,能够完成人类才能完成的任务并不断提高机器自身。从1956年“美国达特矛斯会议(DARTMOUTH CONFERENCE)”提出人工智能学科算起,61年来发展成为一门广泛的交叉和前沿科学。全世界几乎所有大学计算机系都有人研究这门学科,学习计算机的大学生也必须学习这样一门课程。北大清华甚至有人工智能系,但是效果并非很好。
DARTMOUTH会议后的7年中,AI研究开始快速发展.虽然这个领域还没明确定义,会议中的一些思想已被重新考虑和使用了。CARNEGIE MELLON大学和MIT开始组建AI研究中心。研究面临新的挑战:下一步需要建立能够更有效解决问题的系统,例如在"逻辑专家"中减少搜索;还有就是建立可以自我学习的系统。
1957年AI程序"通用解题机"(GPS)第一个版本进行了测试。这个程序是由制作"逻辑专家"的同一个组开发的。GPS扩展了WIENER的反馈原理,可以解决很多常识问题。两年以后,IBM成立了一个AI研究组。HERBERT GELERNETER花3年时间制作了一个解几何定理的程序。
1958年,当越来越多AI程序涌现时,MCCARTHY宣布了他的新成果:LISP语言,成为AI史上的突破。LISP到今天还在用,LISP意思是"表处理"(LIST PROCESSING),它很快就为大多数AI开发者采纳。
1963年MIT从美国政府得到一笔220万美元的资助,用于研究机器辅助识别.这笔资助来自国防部 高级研究计划署(ARPA),已保证美国在技术进步上领先于苏联.这个计划吸引了来自全世界的计算机科学家,加快了AI研究的发展步伐。
AI测试竞赛:LOEBNER(人工智能类):1991年美国科学家兼慈善家勒布纳设立的对图灵测试的第一种实践,分金银铜三等奖,用文本、音频、视频模仿人类迷惑人类裁判。大多数都不能成功欺骗多名人类裁判。以人类的智慧创造出堪与人类大脑相平行的机器脑(人工智能),对人类来说是一个极具诱惑的领域,人类为了实现这一梦想也已经奋斗了很多个年头了。
以后几年出现了大量程序。"SHRDLU"是"微型世界"项目的一部分,包括在微型世界(例如只有有限数量的几何形体)中的研究与编程。在MIT由MARVIN MINSKY领导的研究人员发现,面对小规模的对象,计算机程序可以解决空间和逻辑问题。60年代末STUDENT解决代数问题,"SIR"可以理解简单的英语句子.这些程序的结果对处理语言理解和逻辑有所帮助。
70年代专家系统可以预测在一定条件下某种解的概率。由于当时计算机已有巨大容量,专家系统有可能从数据中得出规律。专家系统的市场应用很广。十年间,专家系统被用于股市预测,帮助医生诊断疾病,以及指示矿工确定矿藏位置等。这一切都因为专家系统存储规律和信息的能力而成为可能。
70年代许多新方法被用于AI开发,如MINSKY的构造理论。另外DAVID MARR提出了机器视觉方面的新理论,例如,如何通过一副图像的阴影,形状,颜色,边界和纹理等基本信息辨别图像。通过分析这些信息,可以推断出图像可能是什么。1972年同时期另一项成果是提出PROLOGE语言。
80年代期间AI前进更为迅速,并更多地进入商业领域.1986年,美国AI相关软硬件销售高达4.25亿美元。专家系统因其效用尤受需求,象数字电气公司这样的公司用XCON专家系统为VAX大型机编程.杜邦,通用汽车公司和波音公司也大量依赖专家系统。为满足计算机专家的需要,一些生产专家系统辅助制作软件的公司,如TEKNOWLEDGE和INTELLICORP成立了。为了查找和改正现有专家系统中的错误,又有另外一些专家系统被设计出来。
美国人工智能协会基金会、私人公司研究人员热潮。150多所像DEC(它雇了700多员工从事AI研究)这样的公司共花了10亿美元在内部的AI开发组上。其它AI领域也在80年代进入市场。其中一项就是机器视觉。MINSKY和MARR的成果如今用到了生产线上的相机和计算机中,进行质量控制。尽管还很简陋,这些系统已能够通过黑白区别分辨出物件形状的不同。到1985年美国有一百多个公司生产机器视觉系统,销售额共达8千万美元。
80年代AI工业不全是好年景。86-87年AI系统需求下降,业界损失近5亿美元。像TEKNOWLEDGE和INTELLICORP两家共损失超过6百万美元,大约占利润的三分之一巨大的损失迫使许多研究领导者削减经费。另一个令人失望的是国防部高级研究计划署支持的所谓"智能卡车"。这个项目目的是研制一种能完成许多战地任务的机器人。由于项目缺陷和成功无望,PENTAGON停止了项目的经费。
1996年2月10~17日,GARRY KASPAROV以4:2战胜“深蓝”(DEEP BLUE)。但是,到了1997年5月3~11日,GARRY KASPAROV以2.5:3.5输于改进后的“深蓝”。IBM公司研制的深蓝(DEEP BLUE)计算机战胜了国际象棋大师卡斯帕洛夫(KASPAROV)。计算机以它的高速和准确为人类发挥着它的作用。人工智能始终是计算机科学的前沿学科,计算机编程语言和其它计算机软件都因为有了人工智能的进展而得以存在。
2003年2月GARRY KASPAROV 3:3战平“小深”(DEEP JUNIOR)。
2003年11月GARRY KASPAROV 2:2战平“X3D德国人”(X3D-FRITZ)。
2016年4月AlphaGo战胜人类围棋手。12月底到2017年1月,AlphaGo升级版战胜108名世界围棋手。
3、人工智能应用领域(机遇与挑战)
人工智能的研究范畴:自然语言理解、语言的学习与处理,知识获取表示、知识处理系统,自动推理和搜索方法、智能搜索,推理,规划,机器学习,组合调度问题,感知问题,模式识别、逻辑程序设计、自动程序设计,软计算,不精确和不确定的管理,人工生命,计算机视觉、神经网络,智能机器人、复杂系统,遗传算法人类思维方式等方面。最关键难题是机器的自主创造性思维能力的塑造与提升。
人工智能实际应用领域主要有:专家系统、机器翻译、智能控制、定理证明、博弈、自动程序设计,自动规划、智能搜索引擎、机器人学,语言和图像理解,遗传编程,计算机视觉和图像处理、机器翻译和自然语言理解、机器视觉,指纹识别、人脸识别、视网膜识别、虹膜识别、掌纹识别,数据挖掘和知识发现、遗传编程机器人工厂、自动程序设计、航天应用、庞大的信息处理、储存与管理、执行化合生命体无法执行的或复杂或规模庞大的任务等等。
机器翻译:是人工智能的重要分支和最先应用领域,机译系统的译文质量离终极目标仍相差甚远;而机译质量是机译系统成败的关键。中国数学家、语言学家周海中教授曾在论文《机器翻译五十年》中指出:要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题。人类尚未明了大脑是如何进行语言模糊识别和逻辑判断,故而机译很难达到“信、达、雅”的程度。智能家居之后,人工智能成为家电业的新风口,而长虹正成为将这一浪潮掀起的首个家电巨头。[3]
模式识别:采用$模式识别引擎,分支有2D识别引擎,3D识别引擎,驻波识别引擎以及多维识别引擎;2D识别引擎已推出指纹识别,人像识别,文字识别,图像识别,车牌识别;驻波识别引擎已推出语音识别;3D识别引擎已推出指纹识别玉带林中挂(玩游智能版1.25)。
自动工程:自动驾驶(OSO系统)、印钞工厂(¥流水线)、猎鹰系统(YOD绘图)。
知识工程:以知识本身为处理对象,研究如何运用人工智能和软件技术,设计、构造和维护知识系统;
智能模拟:机器视、听、触、感觉及思维方式的模拟:指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别,专家系统,智能搜索,定理证明,逻辑推理,博弈,信息感应与辨证处理。
AI实现方法:一种是工程学方法(ENGINEERING APPROACH),这种方法用传统编程技术,使系统呈现智能的效果,不考虑所用方法是否与人或动物机体所用的方法相同。它已在一些领域内作出了成果,如文字识别、电脑下棋等。另一种是模拟法(MODELING APPROACH),不仅要看效果,还要求实现方法也和人类或生物机体所用的方法相同或相类似。如遗传算法(GENERIC ALGORITHM,简称GA)和人工神经网络(ARTIFICIAL NEURAL NETWORK,简称ANN)均属此类型。
AI规划问题:智能AGENT必须能够制定目标和实现这些目标。他们需要一种方法来建立一个可预测的世界模型(将整个世界状态用数学模型表现出来,并能预测它们的行为将如何改变这个世界),这样就可以选择功效最大的行为。
情感计算等社交:KISMET具有表情等社交能力的机器人,情感和社交技能对于一个智能AGENT是很重要的。首先,通过了解他们的动机和情感状态,代理人能够预测别人的行动(这涉及要素 博弈论、决策理论以及能够塑造人的情感和情绪感知能力检测)。此外,为了良好的人机互动,智慧代理人也需要表现出情绪来。至少它必须出现礼貌地和人类打交道。至少,它本身应该有正常的情绪。
机械学习:从使用者和输入数据等处获得知识,从而可以解决问题减少错误,提高解决问题的效率。对于人工智能来说,机械学习从一开始就很重要。1956年,在最初的达特茅斯夏季会议上,雷蒙德索洛莫诺夫写了一篇关于不监视的概率性机械学习:一个归纳推理的机械。
自然语言处理:自然语言处理如翻译、应答、聊天机器人、客服等。
机器感知、计算机视觉和语音识别:机器感知指能够使用传感器所输入的资料(如照相机,麦克风,声纳以及其他的特殊传感器)然后推断世界的状态。计算机视觉能够分析影像输入。另外还有语音识别、人脸辨识和物体辨识。
E. 数据简化DataSimp技术描述、学会及社区(1k字)
1、数据简化DataSimp技术描述(4b字)
数据简化DataSimp合伙人或XX岗位(研发岗参考本蚊及文本分析一文的二级标题)。
1)技术研发部(重点收简历):核心的数据分析DA、NLP、DL开发技能,Windows/Linux/Android/iOS平台、OA、App软件开发基础,熟练的Java/C++/Python编程技能和Github/Git协作编程与同行审核习惯;
2)市场客服部(研发部兼职):搜集客户资料、面见客户、形成客户需求分析文档,跟踪反馈,面谈、电邮、电话、邮寄沟通服务;
3)行政后勤部(合伙人兼职):高级的全系列文档搜集整理技能,OA软件界面和操作体验实验,公司法律财会物业文书基础。
投递简历前,如果对编程目标不清楚,可以参考上图6,或实用文本分析工具▼http://ictclas.nlpir.org/nlpir/网站,我们需要实现一个功能集合大于此网站的应用程序系统。愿景①是跨平台的分析系统,先开发文本的明文分析系统(后续开发加密文本分析系统),实现输入需要分析的文本、文档、文件夹,就可以得到可选定的分析结果,使用极其简单、功能极其强大。这也是当前数据简化DataSimp筹备收简历的主要方面,合伙人和员工均可。
2、数据简化DataSimp学会及社区(6b字)
筹备之数据简化DataSimp学会及社区。数据简化DataSimp学会分多个专业领域组,由普通会员和会士组成。会士则由资深数据分析专家组成学会分组委员会,会士认证采用“场景-方案-答辩制”2年一次,以推动全领域数据简化工作的有序进行。数据简化DataSimp社区由学会和贡献者共同维护,包括:学会版块、开源社区、活动版块。
●学会版块:数据简化DataSimp学会各领域工作组的主要版块,发布工作动态和成果。未来择优出版为期刊。工作组主要有:社会信息简化需求大组、数据简化需求大组、技术实现与分析评估组(分为文本简化、图像简化、音频简化、视频简化、机器数据简化、过程控制逻辑简化等数据简化小组)、系统与哲学思维简化大组等。
●开源社区:由数据简化DataSimp学会资深程序员贡献运维,使得社会信息简化技术人员可以熟练掌握各类大数据组件、系统、工具在数据简化方面的原理、架构、部署、应用场景、维护、应用和开发技巧等。。数据简化DataSimp爱好者可以自助提交并发起讨论,以推动程序简化技术、提高数据简化效率。旨在通过详细讲解和实战演练,能够帮助企业技术人员掌握最有效的数据简化技能。
●活动版块:数据简化DataSimp学会线上线下发起的讲座、问答、竞赛、考察、管理等活动。
当今社会信息爆炸、数据爆炸、垃圾信息和数据爆炸,请大家行动起来,加入我们数据简化学会和社区,一起为人类社会的信息世界和数据世界优化、简化、提高效率做贡献。详情落地前发文宣传,敬请期待。
QinDragon2010@DataSimplification and Sciences,Wechat and Toutiao Public Account,2017.02.16Thu-26Sun:
LIFE
Life begins at the end of your comfort zone. -- Neale Donald Walsch
THE DAY
The strength of purpose and the clarity of your vision,along with the tenacity to pursue it,is your underlying driver of success. -- Ragy Tomas
(西安秦陇纪10数据简化DataSimp综合汇编,欢迎有志于数据简化之传媒、技术的实力伙伴加入全球“数据简化DataSimp”团队!欢迎转发声明:秦陇纪10公众号、头条号“数据简化DataSimp”科普文章。)