读《智能时代》后的些许总结

人工智能模式的萌芽历程(资料收集+他人观点归纳+个人观点)

以大数据和机器智能的两大重要技术突破为核心的人工智能战略模式将对我们的技术发展、商业和社会都会产生巨大影响。该模式所引领的智能革命,将会在不久的将来开创人类历史上纪元上的智能时代。首先,在过去我们认为难以解决的问题将因为大数据和机器智能的使用迎刃而解,比如疑难疾病的个性化治疗。与此同时,大数据和机器智能将彻底改变未来的商业模式,很多传统行业将采用智能技术实现升级换代,同时改变原有的商业模式。但是正如历史上的几次产业革命一样,智能革命的开启必将对社会各个阶层带来全方位的冲击。在即将来临的浪潮面前,我们个人能做的就是未雨绸缪,将自己的思维方式更新换代,成为走在变革前2%的人,最大程度的避免它对我们带来的负面影响。

如果我们把资本和机械动能作为大航海时代以来全球近代化的推动力的话,那么数据将成为下一次技术革命和社会变革的核心动力

如果想知道大数据的推动作用,需要先对“数据”这个概念有一个认识。数据是文明的基石,人类对它的认识反映了文明的程度。首先区分信息和数据。数据和信息具有相通之处,人们交谈时,它们之间含义相差不大。信息是关于世界、人和事的描述,它比数据更抽象。而数据最大的作用便是承载信息,当然并非所有的数据都承载了有意义的信息。所以只有善用数据,我们才能够得到数据背后的信息。而这个“善用”就需要具有相关领域专业知识的人才将隐藏在数据中的信息和知识挖掘出来。有了数据和知识,我们对其进一步处理后,人类方可得到知识。我们人类的进步就是靠使用知识不断地改变我们的生活和周围的世界,而数据是知识的基础。回看人类的文明过程,发现我们人类使用数据是具有一个标准的流程的:从获取数据到分析数据,然后根据数据分析的结果建立模型,通过模型来预测未知。正如前文所说,数据在人类文明中起到了基石的作用。如何点石成金使用数据,这就要考虑相关性。很多时候我们无法直接获得信息,但是我们可以将相关联的信息量化,然后通过概率论和统计学知识建立数学模型,从而间接地得到所要的信息。建立数学模型是一个极其重要的过程,过去人们为避免模型选的不好后期重复的修修补补,往往先花费大量的时间选择合适的模型,然后再通过数据找到模型的参数。但是因为寻找近乎完美的模型太困难。理论上有人发现只要找到足够多的具有代表性的样本,就可以运用数学找到一个模型或者一组模型的组合使它和真实情况十分接近。实践上,采用多而简单的模型常常比一个精确的模型成本更低,因此使用也更普遍。由此我们有了数据驱动方法,即只要数据量足够,就可以用若干个简单的模型取代一个复杂的模型。这种方法最大程度上利用了现有的计算机技术。尽管在一开始,数据驱动方法数据量不足,计算时间不够得出的模型会比较粗糙,但随着时间的推移,摩尔定律保证了计算能力和数据量以一个指数级增长的速度递增,从而得到的模型可以非常精确。AlphaGo便是这一方法的代表结果。对于数据驱动方法,它是大数据的基础,也是智能革命的核心,它带来了新的思维方式。

在有大数据之前,计算机并不擅长于解决人类智能的问题,但是今天这些问题换个思路就可以解决了,其核心问题是变智能问题为数据问题。由此,全世界开始了一轮新的技术革命——智能革命

1950年,图灵在《思想》杂志上发表论文——《计算的机器和智能》提出了一种验证机器有无智能的判别方法。让一台机器和一个人坐在幕后,让一个裁判同时与幕后的人和机器进行交流,如果这个裁判无法判断自己交流的对象是人还是机器,就说明这台机器有了和人同等的智能。即后人所称的图灵测试。计算机科学家认为只要计算机可以实现语音识别、机器翻译、文本的自动摘要或者写作、战胜人类的国际象棋冠军或自动回答问题这五件事情中的一件,即可称为拥有图灵所说的那种智能。1956年夏天,克劳德香农和赫伯特西蒙、约翰麦卡锡、马文明斯基、纳撒尼尔罗切斯特于达特茅斯学院举行了一场头脑风暴,会上首次提出了“人工智能”(ArtificialInteligience)这个说法。之后在人工智能的探索历程中,出现了人工智能1.0的概念,这种传统的人工智能方法就是首先了解人类是如何产生智能的,然后让机器人按照人的思路去做。但是在这条道路上人类走了10年几乎没有任何突破。1968年明斯基提出观点“目前的科学方法无法让计算机真正有类似于人的智能”此后全世界人工智能在学术界又低沉20年。20世纪70年代,科学家换了一条路,人类开始尝试机器智能的另一条发展道路,即采用数据驱动和超级计算的方法。康奈尔大学教授弗雷德贾里尼克在IBM做学术休假时负责了“聪明的计算机”项目之一——计算机自动识别人的语言。在他之前主流研究方法有两个特点,一是让计算机尽可能地模拟人的发音特点和听觉特征,二是利用人工智能的方法理解人所讲的完整的语句。但是结果很差,计算机大约智能百十个单词,识别率为70%左右。贾里尼克是一位通信专家,他独辟蹊径通过用两个数学模型分别描述信源和信道,并利用当时已经成熟的数字通信的各种技术实现语音识别。使得计算机可以识别两万多词,识别率达到了90%以上。其中的关键在于他的数学模型十分精确,这种精确源于他利用IBM超强的计算能力和大量的数据“训练出”数学模型的参数。这种采用统计的方法解决智能问题的途径被称为数据驱动方法。同样李开复学习贾里尼克的方法,在传统的人工智能实验室里采用基于统计的方法,和洪小文一起构建了世界上第一个大词汇量、非特定人、连续语音识别系统。随后,20世纪80年代彼得布朗,将数据驱动方法用于机器翻译。之后人工智能开始了为期十几年的缓慢但稳步的发展。2005年,在翻译专家弗朗兹奥科博士的带领下,谷歌利用比其他研究所多几千倍甚至上万倍的数据,研究出了一套六元模型用于机器翻译,在美国国家标准与技术研究所主持的世界范围内测评和交流中以巨大的优势一举击败全世界其他所有机器翻译研究团队。其突破的关键在于奥科博士采用其他机构上万倍的数据进行数据驱动方法时,量变的积累导致了质变的发生。大数据有三大特征,第一具有海量的数据。第二,具有多维度的特征。数据一旦涉及到了各个维度,便可对其进行挖掘加工和整理得到有意义的统计规律。第三具有全面性或者称为完备性。即覆盖所能覆盖的一切可能。当然大数据也可以具备时效性但不是必须的,时效性可以做到我们过去做不到的一些事情,比如城市的智能交通管理系统。在大数据之前,人类所采取的方法难以解决机器智能的问题,然而转换思路之后,利用数据驱动方法,智能问题被转化为了数据问题。也就是说机器获得智能的方法并不是和我们人类一样靠推理,而是更多的利用大数据,从数据中学习获得信息和知识。因此我们对大数据重要性的理解已经不是停留在统计、改进产品和销售,或者提供决策的支持上了,而应看到它同摩尔定律、数学模型一起导致了机器智能的产生。

在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这便是大数据思维的核心

从方法论的层面来看,大数据是一种全新的思维方式。它改变了我们过去指导我们日常做事行为的最重要的一种思维方式——机械思维。首先机械思维的形成可以追溯到古希腊。欧洲之所以能够在科学上领先于世界的其他地方,在很大程度上是依靠从古希腊建立起来的思辨的思想和逻辑推理的能力,依靠他们可以从实践中总结出最基本的公理,然后通过因果逻辑构建起整个科学的大厦。最初欧几里得将他的公理化体系几何学写成了一本书叫《几何原本》,这种基于逻辑推理的公理化系统为未来几何学、数学和自然科学的发展奠定了基础,对西方思维方式产生了巨大影响。之后过了5世纪,罗马时代伟大的天文学家托勒密将这种方法运用到天文学上,建立起一套完整、严格而且相当精确的描述天体运动规律的理论体系,即地心说。同时发明了球坐标,定义了包括赤道和零度经线的经纬线,提出了黄道,发明了弧度制等。而托勒密的方法论可以概括为“通过观察获得数学模型的雏形,然后利用数据来细化模型”这种朴素的方法在今天仍然被大部分的经济学家使用。其核心思想有两点:首先,需要有一个简单的元模型,这个模型可能是假设出来的,然后再用这个元模型构建复杂的模型;其次,整个模型要和历史数据吻合。但是托勒密的方法论有缺陷,一是整体模型很复杂。当然通过现在的人工神经网络在几万台服务器上这种复杂模型带来的计算问题可以解决。二是确定性假设。它假定模型一旦形成,就是确定的和不会改变的。随后在古希腊罗马以后,人类对自然的认识就放慢了许多,西方进入黑暗时代,东方虽有技术进步但是没有形成科学体系。直到笛卡尔和牛顿的出现。笛卡尔的贡献是提出了科学的方法论,即大胆假设小心求证。但是机械思维的开创和集大成是牛顿的方法论,概括起来是三点:第一,世界变化的规律是确定的。第二,因为有确定性保障,因此规律不仅是可以被认识的,而且可以用简单的公式或者语言描述清楚。第三,这些规律应该是放之四海而皆准的,可以应用到各种未知的领域指导实践。当然之后在机械的思维方式和机械的广泛使用下导致了人类迄今为止的最伟大事件——工业革命。而我们其实可以看到,机械思维更广泛的影响力是作为一种准则指导人们的行为,其核心思想是确定性(可预测性)和因果关系。与此同时,机械思维具有两面性——善于把握确定性而难以解决不确定性问题。但是现实世界不确定性也是无处不在的,世界的不确定性源于两个方面,一个方面是数据量太大导致的,这是由于我们对这个世界了解德越细致之后,发现影响世界的变量其实非常多,已经无法通过简单的办法或公式算出结果。因此我们宁愿采用一些针对随机事件的方法来处理他们。另一个方面是因为世界本身带有的不确定性,比如量子力学里的测不准原理。总而言之,世界上很多事情难以用确定的公式或规则表示,但可以用概率论模型来描述。在此基础上,香农博士建立起了一套完整的理论,将世界的不确定性和信息联系了起来,这就是信息论。对于信息论,不想详细阐述。但是它作为一个工具和方法论对于理解大数据本质有重要作用。首先我们必须承认世界的不确定性,这样我们就不会采用确定性的思维方式去面对一个不确定性的世界。当我们了解到信息或者说数据能够消除不确定性之后,便能理解为什么大数据的出现能够解决那些智能的问题,因为很多智能问题从根本上来讲就是消除不确定性的问题。大数据时代我们得益于一种新的思维方法——从大量的数据中直接找到答案,即使不知道原因。用数据包含的信息消除不确定性,用数据的相关性取代因果关系。大数据思维并不是与机械思维完全对立,它更多是对后者的补充。

在未来我们可以看到,大数据和机器智能的工具就如同水和电这样的资源,由专门的公司提供给全社会使用

每一个人、每一个企业在接受大数据思维,改变做事情的方式后,就有可能实现一些在过去都不敢想的梦想。2015年7月,亚马逊的市值超过了沃尔玛,标志着新时代的到来——以大数据为基础的电子商务将超越传统的零售商业。同时也是受大数据思维的影响,Netflix随着数据量的积累,做到了对用户的精准推荐。2016年初,Netflix的市值超过传统的电视网、默多克的Direct TV。大数据在商业活动中从细节到整体再从整体到细节双向的流动,使得我们不仅能够利用大数据对商业进行整体提升,更能够精确到每一个细节。比如RFID技术在顺丰下,我们可以实时在第一时间知道快件所处于运输中的位置。在Prada的运用下,其销售额增长速度远高于世界经济增长速度。利用大数据的思维方式,再来审视穷举法。因为实际抽样调查中在有限的样本中找到覆盖尽可能全的规律是困难的,但当我们用穷举法时,样本可以等于全集。方便了我们对特殊情况做特殊处理,反而是机械思维做不到的。这也有一次体现了大数据完备性。Google的自动驾驶汽车便依赖于此。他之所以能自动驾驶,是借助了谷歌街景技术,Google已经早就拥有非常完备的海量路况信息。从历史上看,,一项技术带动整个社会变革的事情也发生过,它通常遵循一个模式即“新技术+原有产业=新产业”工业革命时期是“现有产业+蒸汽机=新产业”。蒸汽机这一标准通用的的动力系统为人类经济上的第一次腾飞提供技术支持。第二次工业革命,电取代蒸汽成为了新型能源,同时也导致了各种电器的发明,催生了很多新兴产业。同时电也是化学工业的催化剂,让化学从实验室走向了产业化,因此第二次工业革命总结为“现有产业+电=新产业”。二战后的信息技术带来了新的产业革命。首先创造力一批于信息的产生、传输、和处理有关的产业,比如电视传媒、通信、卫星等。另一方面,很多企业在使用了计算机后产生了本质的变化。比如由于引入了NASDAQ,证券交易的交易成本大幅度降低催化的金融业的发展。1965年摩尔博士提出的摩尔定律,使得计算机性能提升的同时,价格反而降低,以至于它可以被用到生活中的方方面面。因此过去半个世纪世界的进步背后最根本的动力可以概括为摩尔定律的应用,即数字化。“现有产业+摩尔定律=新产业”成为这个信息时代的特点。而对于未来,由大数据引发的智能革命我们也可以用两个公式概括“现有产业+大数据=新行业,现有产业+机器智能=新产业”。未来产品的服务水平不完全取决于厂商对它的重视程度和相关技术,而更多要依靠智能化。未来商家将在数据层面和智能化方面展开竞争。

大数据的数据量大、纬度多、数据完备等特点,使得它从收集开始,到存储和处理,再到应用,都与过去的数据方法有很大的不同。因此,使用好大数据也需要在技术和工程上采用与过去不同的方法

每一次技术革命出了有生产力发展需求,还要有很多技术准备,只有当所有这些必要的技术都成熟时,技术革命才变为可能。科学技术的发展并非是匀速的。在技术积累到一定地步后,科技在短时间内获得单点突破,然后新科技全面迸发,这便是拐点。而机器智能的概念已经被提出60多年,但是真正的突破却在具有了大数据的今天。因此智能技术的拐点可能就发生在从十年前开始到接下来的一二十年。大数据的拐点会发生在今天,有几个技术条件上的原因。从数据的产生上看,一个来源是全球数字化让几乎每一个是用电的设备都有了一个“电脑”,记录了大量设备状态的日志。另一个来源是传感器。传感器技术的进步使得收集数据变得非常容易。比如RFID或者是无处不在的摄像头。第三个来源是那些过去已经存在的、以非数字化形式存储的信息数字化。第四个,移动互联网的普及,使得我们在使用智能手机的时候无时无刻不在产生着数据。从数据的存储上看,七八年前的半导体固态存储器的容量增加成本下降,使得人们能够很方便地使用数据,这时从存储技术上讲,使用大数据的时机才成熟。从传输的技术上来看,移动互联网时代4G使得我们的有效传输传输速度达到了2MB/s~10MB/s。同时Wi-Fi的覆盖率也非常之高,这些都使得数据产生之后能迅速传到服务器上。从数据的处理角度看,2002以后以Google为首的大公司解决了讲一个大的计算任务分到多太便宜的服务器上去做并行运算的难题。但是伴随着技术的进步,我们也会面临一个更大的挑战也就是对数据安全性的担忧和对隐私的诉求。数据安全有两层含义,首先保证用户的数据不损坏、不丢失。经过十年的云计算的普及,大家已经逐渐习惯并相信了将数据存储到云端的安全性实际上比存储在自己手机或电脑上更安全。第二层含义是,保证数据不会被偷走或者盗用。虽然仍然存在漏网的黑客,但是现在已经开始采取一种行之有效的方式即利用大数据本身的特点,及时发现并制止异常操作来保护大数据的信息安全。保护隐私将在未来成为大家重要的诉求,现在人们更倾向于在隐私与便利性之间选择便利性,下载各种免费app的同时泄漏的是自己的隐私,隐私就像自由在悄无声息的流失过程中我们不知道去珍惜,当明白过来的时候我们已经失去了自由。在未来我们甚至将面临一个零隐私的社会。因此,隐私保护问题我们不得不认真考虑。

现有产业+机器智能=新产业,未来的农业、制造业、体育、医疗、律师、甚至编辑记者行业都将迎来崭新形态,新产业将取代旧产业满足人类的个性化需求、大数据将导致我们整个社会的升级和变迁。

未来的智能产业将出现两个特点智能化和精细化。下面将挑选几个产业进行分析。首先是农业,农业是人类所从事的最古老的行业,也是支撑人类文明的基础。工业革命后,由于机械在农业上的应用,每个人能够耕种的土地和收获的粮食大大增加,解放了大量劳动力从事工业和服务业的劳动。但是,自然环境,比如土地面积和降雨量依然是制约农业发展的瓶颈。过去解决土地短缺问题的方法是施用化肥和农药增加单产,解决水资源短缺的方法是挖更多的井抽水和渠引水,但这都是将短期矛盾转变为长期的危机的做法。以色列人在极度缺水的环境中(年降水量比乌鲁木齐还低)利用滴灌技术——装有滴头的管线直接将水和肥料送达植物的根系,大大节约了水和肥料。所有的灌溉方式都采用计算机进行自动化控制,灌溉系统中有传感器,能通过检测植物茎果的直径变化和地下适度,来决定对植物的灌溉量,这样可以节省人力和水资源。自以色列建国以来,农业生产增加了十倍,但每亩地的用水量保持不变。棉花单产是中国的四倍,柑橘亩产是中国的6倍,并且是世界上第二大花卉出口国,农产品40%用于出口。以色列将荒漠的内盖夫地区变成了大片大片的绿洲。在引入机器智能之后,农业将会以更加崭新的形态出现。未来的体育,金州勇士队能够在过去的三年内实现崛起,一个很重要的原因是将大数据分析引入篮球。通过大数据分析,发现过去几十年NBA发展追求的制空权的打法是低效率错误的,而利用外线的三分球将可以做到利益最大化。于是勇士队开始培养斯蒂芬库里,同时主教练科尔利用大数据对历史中NBA的统计发现最有效的进攻是眼花缭乱的传球和准确的投篮,而不是彰显个人能力的突破和扣篮。除了利用数据制定球队进攻战略外,勇士队还利用实时数据及时调整比赛中的战术,在世界大数据会议上球队首席运营官介绍他们利用大数据帮助球队改进精细到两个人配合的细节。大数据对体育训练的帮助还在与分析和总结优秀选手的运动姿势,纠正其他运动员的动作。可以预见,未来的竞技体育是离不开大数据和机器智能的。未来的制造业,2011年德国提出工业4.0,通过数字化和智能化来提升制造业水平。中国相应提出中国制造2025的概念。而在美国,特斯拉汽车公司已经尝试全部使用机器人来装配汽车,不仅使得工厂雇佣工人的数量大幅度减少,而且让出厂的汽车性能和质量更加稳定。机器人取代人类从事制造业的另一个巨大优势在于,产品很容易按照个性化定制。这是过去的标准化做不到的。同时特斯拉取消了汽车代理商制度。特斯拉已经在悄无声息的重新定义汽车行业,在引入大数据和机器智能之后,汽车这个老行业将变成一个全新的行业。未来的医疗,通过利用机器智能现在已经开发出来了手术机器人达芬奇手术系统,目前全世界装配了3000台,完成了300万例手术。机器人在诊断和手术方面有三大优势,首先误判漏判可能性低,准确率高,稳定性好。同时IBM开发的沃特森智能系统已经可以达到中等医生水平,可以预见不久的将来,计算机将在诊断和手术方面取代人。对于制药行业,引入大数据我们可能克服癌症,因为癌症产生的原因是癌细胞基因突变,而致死率高的原因是,在治疗的过程中会出现二次变异,导致基因治疗药物失去效果,但是如果我们利用大数据,将所有可能的恶性基因复制错误和各种癌症的组合全部找到,针对每一种组合都找到对应的药物,这样针对不同人癌症的病变,只需要从药品库选一种药即可。对于未来的律师行业,大数据给司法领域带来的影响在于机器智能会逐步取代律师做一些案例分析工作,这使得诉讼成本大幅度下降。今天一些公司已经利用自然语言处理和信息检索技术,发明了让计算机阅读和分析法律文献的软件,可以取代很多人工,与此同时初级水平的律师将面临大批的淘汰。

在历次技术革命中,一个人,一家企业,甚至一个国家,可以选择的道路只有两条:要么加入浪潮,成为前2%的人,要么观察徘徊,被淘汰

智能时代无疑将给我们带来一个更美好的社会,它是智能的、精细化的和人性化的,它无疑是迄今为止人类文明史上最好的社会。但是从另一个方面,智能革命也将给我们带来空前的挑战。随着大数据和机器智能的不断普及,我们会发现机器越来越多的占据了我们人类的工作机会,这个过程一开始悄无声息,一旦发展到一个拐点将不可逆转。

首先分析我们未来的社会面貌,首先是智能化社会,大数据和机器智能将把我们的社会管理水平提升到一个前所未有的高度,使我们的生活环境更加安全。尤其是通勤行业利用大数据优化城市的交通资源,统筹每一个人每天的出行状况甚至是活动安排。甚至可以根据实时流量和对未来流量的预测,调整交通信号灯的时间。大大降低我们每天每个人的通勤时间。总之将使我们的生活变得更加方便,社会资源的利用率极大地提高。未来的社会也是精细化的的社会,我们可以去追踪每一次交易。通过区块链技术,在未来每一件商品从制造出来到消费整个完整的形成都可以被追踪。未来智能时代,机器的智能水平足以为我们提供各种个性化服务,同时做到成本和过去的标准化服务相当。使得我们享受整个文明质的飞跃

大数据和智能革命对未来社会的冲击不容小视,我们可能生活在一个没有隐私的环境里,或许会被一些超级权利在无形中控制,甚至很多人因为没有掌握未来生存的技能而找不到工作,财富可能会更加集中到少数人手里。首先是对于个人隐私的影响,移动互联网(以及正在迅速发展的万物互联技术)协同大数据和机器智能三者叠加到一起,我们不再有隐私可言。我们首先对这个威胁缺乏认识,不知道大数据的威力,不知道多维度的信息凑到一起能够得到一个人完整的画像,不知道挖掘信息的工作只需要交给机器,甚至一厢情愿把个人隐私寄托在数据拥有者的善意上。一旦掌握大量用户数据的公司和用户发生利益冲突,我们的隐私将受到极大的侵犯。我们无法指望通过立法的手段解决保护隐私的问题,大陆法系的国家立法远远滞后于案件的发生。比如中国电子商务发展这么多年,中国至今没有出台相应的集体诉讼赔偿法规和有效的执法手段。而且全世界范围对偷盗数据和利用大数据侵犯个人隐私的行为都没有相应的立法,未来或许像《1984》里描述的似的到处都有“老大哥”在看着你。2016年,苹果和FBI之争让我们不禁产生担忧,如果一家公司或者政府部门有能力获得和随意使用每一个人的隐私,那么他们将拥有超级权力,而历史证明任何不受约束的超级权利最后都将会带来灾难。机器人将抢走很多人的饭碗,当计算机变得足够聪明之后,一定会取代人类完成很多需要高智力的工作。而历史经验表明,当社会面对重大技术革命所产生的冲击不知所措,需要两代人才能消除它的负面影响。比如工业革命后的半个世纪,原有的经济结构被摧毁,考有一技之长的工匠运作的小作坊纷纷破产,工匠的特长敌不过劳工结实的身体,从中产阶级沦为赤贫。从狄更斯的笔下我们看到了那个时代英国贫富分化严重,社会矛盾重重。直到1851年世界上第一次世博会之后,英国人才通过资本输出,开拓全球殖民地,推行自由贸易将工业革命的副作用消解。第二次工业革命期间,电的使用让美国和德国迅速发展崛起。但在美国第二次工业革命刚开始一段时间,美国的贫富分化程度达到了北美殖民以来最高点,同时从马克吐温等人的笔下了解到下层社会生活悲惨,工人运动迭发。南方传统经济被彻底破坏,时至今日仍远落后于北方。至于这两个国家消除这种负面影响的方式不相同,美国将大量的产能用于中西部的开发,而德国国土面积狭小,为了输出产能不得不发动第一次世界大战。虽然我们对历史上重要的技术革命代表人物很推崇,但要认识到它所带来的福祉从少数精英开始,经过半个世纪才开始造福技术革命的中心地区,随后才是造福世界。现在我们将面临的是“二战”后的信息技术革命所带来的信息时代负面影响仍未消除,智能革命的冲击已经到来。信息时代,适合年轻人的工作已经越来越少,而到了智能革命之后,任何简单动脑的工作都将要消失,甚至现在从事所谓的高大上职业比如律师、医生、会计等,也会失去其工作。现在看来解决这个问题只有靠时间。但是对我们个人来说我们要争当2%革命浪潮中受益的人而不是作为剩下的98%被淘汰。其实并不是说我们每个人都要投身于研发大数据和人工智能的上班,而是要接受心的思维方式,利用好大数据和机器智能这些技术,利用这些技术去创造新的商业机会。那些从事传统行业的人和大数据及人工智能的距离,远比他们想象的要近,如果说远也只是他们心理上和观念上觉得远罢了。

人工智能模式的重要事件

1948年,克劳德香农发表论文《通信的数学原理》,提出信息论,为人工智能模式下重要技术大数据提供了理论解释的基础。

1950年,图灵在《思想》杂志上发表论文——《计算的机器和智能》提出了一种验证机器有无智能的判别方法。

1956年,在达特茅斯学院里麦卡锡、明斯基、罗切斯特和香浓等人首次提出“人工智能”的概念。

1987年,李开复利用弗雷德贾里尼克开创的数据驱动方法同洪小文一起构建了世界上第一个大词汇量、非特定人、连续语音识别系统。

1997年,IBM的深蓝战胜国际象棋世界冠军卡斯帕罗夫。

2005年,从来没有技术积累不为人知的Google,通过大数据的方法在机器翻译领域以巨大优势击败全世界其他所有机器翻译研究团队。

2005年Hadoop项目诞生。Hadoop其最初只是雅虎公司用来解决网页搜索问题的一个项目,后来因其技术的高效性,被Apache Software Foundation公司引入并成为开源应用。Hadoop本身不是一个产品,而是由多个软件产品组成的一个生态系统,这些软件产品共同实现全面功能和灵活的大数据分析。从技术上看,Hadoop由两项关键服务构成:采用Hadoop分布式文件系统(HDFS)的可靠数据存储服务,以及利用一种叫做MapReduce技术的高性能并行数据处理服务。这两项服务的共同目标是,提供一个使对结构化和复杂数据的快速、可靠分析变为现实的基础。

2008年末,“大数据”得到部分美国知名计算机科学研究人员的认可,业界组织计算社区联盟(Computing

Community Consortium),发表了一份有影响力的白皮书《大数据计算:在商务、科学和社会领域创建革命性突破》。它使人们的思维不仅局限于数据处理的机器,并提出:大数据真正重要的是新用途和新见解,而非数据本身。此组织可以说是最早提出大数据概念的机构。

2009年印度政府建立了用于身份识别管理的生物识别数据库,联合国全球脉冲项目已研究了对如何利用手机和社交网站的数据源来分析预测从螺旋价格到疾病爆发之类的问题。

2009年中,美国政府通过启动Data.gov网站的方式进一步开放了数据的大门,这个网站向公众提供各种各样的政府数据。该网站的超过4.45万量数据集被用于保证一些网站和智能手机应用程序来跟踪从航班到产品召回再到特定区域内失业率的信息,这一行动激发了从肯尼亚到英国范围内的政府们相继推出类似举措。

2009年,欧洲一些领先的研究型图书馆和科技信息研究机构建立了伙伴关系致力于改善在互联网上获取科学数据的简易性。

2010年2月,肯尼斯库克尔在《经济学人》上发表了长达14页的大数据专题报告《数据,无所不在的数据》。库克尔在报告中提到:“世界上有着无法想象的巨量数字信息,并以极快的速度增长。从经济界到科学界,从政府部门到艺术领域,很多方面都已经感受到了这种巨量信息的影响。科学家和计算机工程师已经为这个现象创造了一个新词汇:“大数据”。库克尔也因此成为最早洞见大数据时代趋势的数据科学家之一。

2011年2月,IBM的沃森超级计算机每秒可扫描并分析4TB(约2亿页文字量)的数据量,并在美国著名智力竞赛电视节目《危险边缘》“Jeopardy”上击败两名人类选手而夺冠。后来纽约时报认为这一刻为一个“大数据计算的胜利。”

2011年5月,全球知名咨询公司麦肯锡(McKinsey&Company)肯锡全球研究院(MGI)发布了一份报告——《大数据:创新、竞争和生产力的下一个新领域》,大数据开始备受关注,这也是专业机构第一次全方面的介绍和展望大数据。报告指出,大数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。报告还提到,“大数据”源于数据生产和收集的能力和速度的大幅提升——由于越来越多的人、设备和传感器通过数字网络连接起来,产生、传送、分享和访问数据的能力也得到彻底变革。

2011年12月,工信部发布的物联网十二五规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。

2012年1月份,瑞士达沃斯召开的世界经济论坛上,大数据是主题之一,会上发布的报告《大数据,大影响》(Big

Data, Big Impact)宣称,数据已经成为一种新的经济资产类别,就像货币或黄金一样。

2012年3月,美国奥巴马政府在白宫网站发布了《大数据研究和发展倡议》,这一倡议标志着大数据已经成为重要的时代特征。2012年3月22日,奥巴马政府宣布2亿美元投资大数据领域,是大数据技术从商业行为上升到国家科技战略的分水岭,在次日的电话会议中,政府对数据的定义“未来的新石油”,大数据技术领域的竞争,事关国家安全和未来。并表示,国家层面的竞争力将部分体现为一国拥有数据的规模、活性以及解释、运用的能力;国家数字主权体现对数据的占有和控制。数字主权将是继边防、海防、空防之后,另一个大国博弈的空间。

2012年4月,美国软件公司Splunk于19日在纳斯达克成功上市,成为第一家上市的大数据处理公司。鉴于美国经济持续低靡、股市持续震荡的大背景,Splunk首日的突出交易表现尤其令人们印象深刻,首日即暴涨了一倍多。Splunk是一家领先的提供大数据监测和分析服务的软件提供商,成立于2003年。Splunk成功上市促进了资本市场对大数据的关注,同时也促使IT厂商加快大数据布局。

2012年7月,联合国在纽约发布了一份关于大数据政务的白皮书,总结了各国政府如何利用大数据更好地服务和保护人民。这份白皮书举例说明在一个数据生态系统中,个人、公共部门和私人部门各自的角色、动机和需求:例如通过对价格关注和更好服务的渴望,个人提供数据和众包信息,并对隐私和退出权力提出需求;公共部门出于改善服务,提升效益的目的,提供了诸如统计数据、设备信息,健康指标,及税务和消费信息等,并对隐私和退出权力提出需求;私人部门出于提升客户认知和预测趋势目的,提供汇总数据、消费和使用信息,并对敏感数据所有权和商业模式更加关注。白皮书还指出,人们如今可以使用的极大丰富的数据资源,包括旧数据和新数据,来对社会人口进行前所未有的实时分析。联合国还以爱尔兰和美国的社交网络活跃度增长可以作为失业率上升的早期征兆为例,表明政府如果能合理分析所掌握的数据资源,将能“与数俱进”,快速应变。

2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立“首席数据官”一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台——“聚石塔”,为天猫、淘宝平台上的电商及电商服务商等提供数据云服务。随后,阿里巴巴董事局主席马云在2012年网商大会上发表演讲,称从2013年1月1日起将转型重塑平台、金融和数据三大业务。马云强调:“假如我们有一个数据预报台,就像为企业装上了一个GPS和雷达,你们出海将会更有把握。”因此,阿里巴巴集团希望通过分享和挖掘海量数据,为国家和中小企业提供价值。此举是国内企业最早把大数据提升到企业管理层高度的一次重大里程碑。阿里巴巴也是最早提出通过数据进行企业数据化运营的企业。

2014年4月,世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》。报告认为,在未来几年中针对各种信息通信技术的政策甚至会显得更加重要。在接下来将对数据保密和网络管制等议题展开积极讨论。全球大数据产业的日趋活跃,技术演进和应用创新的加速发展,使各国政府逐渐认识到大数据在推动经济发展、改善公共服务,增进人民福祉,乃至保障国家安全方面的重大意义。

2014年5月,美国白宫发布了2014年全球“大数据”白皮书的研究报告《大数据:抓住机遇、守护价值》。报告鼓励使用数据以推动社会进步,特别是在市场与现有的机构并未以其他方式来支持这种进步的领域;同时,也需要相应的框架、结构与研究,来帮助保护美国人对于保护个人隐私、确保公平或是防止歧视的坚定信仰。

2016年,Google的围棋计算机AlphaGo在与世界著名选手李世石的对局中,以4:1取得了压倒性的胜利,成为第一个战胜围棋世界冠军的机器人。

参考文献:

1.吴军.智能时代。北京:中信出版社,2016.

2.吴军.文明之光。北京:人民邮电出版社,2014.

3.吴军.数学之美。北京:人民邮电出版社,2015.

4.托马斯·M·科弗,乔伊·A·托马斯.信息论基础。北京:机械工业出版社,2008.

5.埃里克·施密特,乔纳森·罗森博格,艾伦·伊格尔,重新定义公司。北京:中信出版社,2015.

6,维克托·迈尔-舍恩伯格,肯尼斯·库克耶。大数据时代:生活、工作与思维的大变革。杭州:浙江人民出版社,2012

你可能感兴趣的:(读《智能时代》后的些许总结)