吴军老师的书,我一直都是很喜欢读的,不仅是喜欢他的文笔,书的内容,同时还喜欢的是他做事的态度,这对我的生活影响极深。
今天,把《智能时代》这本书读完之后,也有一种醍醐灌顶的感觉。
近些日子以来,大数据,人工智能在俨然已经是热门话题。身为一名初出茅庐的IT民工,对这些词汇也是屡见不鲜。也正因为身处这样一个环境中,感觉自己似乎离得很近,却又什么都不了解。读完这本书之后,恍然大悟,原来大数据是这样的!它竟然有如此多的妙用,但也可能对未来有着巨大的冲击,而这些可能是我们无法左右的!
大数据 Big data
在计算机出现之前,一般书籍上的文字内容并不被看成是数据,而今天,这种以语言和文字形式存在的内容是全世界各种信息处理中最重要的数据,也是全世界通信领域和信息科技产业的核心数据。这些数据不仅仅是语言和文字为载体的,那些医学影响资料
工业中国的各种设计图纸都可以被划分为数据。事实上它们已经是今天大数据处理的对象了。我们人类本身的活动也被看做成一种数据,比如我们玩游戏的行为、我们的社会关系、我们每天的活动。可以说,数据是文明的基石,人类对它的认识也反应了文明的程度。
只要数据量足够,就可以用若干个简单的模型取代一个复杂的模型。这种方法被称为数据驱动方法。其优势在于,随着时间的推移,摩尔定律保证了计算机能力和数据量以一个指数级增长的速度递增,数据驱动方法可以非常准确。在电子计算机诞生、人类进入信息时代之后,数据的作用越来越明显,数据驱动的方法开始被普遍采用。如果我们把资本和机械动能作为大航海时代以来全球近代的推动力,那么数据将成为下一次技术革命和社会变革的核心动力。
大数据的使用,最大的意义在于它能让计算机完成一些过去只有人类才能做到的事情。比如:语音交流、图像识别等。当计算即的智能水平赶超人类时,我们的社会就会发生天翻地覆的变化,这才是大数据最可怕的结果。
17世纪依赖一直指导我们日常做事行为的最重要的一种思维方式——机械思维。(机械思维源于古希腊,代表性的有欧几里得的几何学 和托勒密的地心说。近代贡献最大的是牛顿)今天,很多人的行为方式和思维方式其实依然没有摆脱机械思维。
机械思维直接带来了工业大发明的时代。天文望远镜、蒸汽机、现代医药学..都是机械思维的结果。机械思维最广泛的影响力是作为一种准则知道人们的行为、其核心思想可以概括成确定性和因果关系。牛顿可以把所有的天体运动规律用几个定律讲清楚,并且应用到任何场合都是正确的,这就是确定性。
在大数据的时代,我们的得益于一种新的思维方法——从大量的数据中直接找到答案。
比较有代表性的数据公司是Google。微软的搜索引擎在很长时间内做不过Google的主要原因并不在于算法本身,而是缺乏数据。在中国,搜狗等小规模的搜索引擎相对百度最大的劣势也在于数据量上。
在外人看来互联万公司竞争的是技术,但更准确的来讲,他们是数据层面的竞争。
在无法确定因果关系的是,数据为我们提供了解决的问题的新方法,数据说包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到我们想要的答案,这边是大数据思维的核心。大数据思维和原有的机械思维并非完全对立,而是对后者的补充。
大数据思维不是抽象的,而是有一整套方法让人们能够通过数据寻找相关性,最后解决各种各样的难题。每一个人,每一个企业接受大数据思维,改变做事情的方式之后,我们就有可能实现一些过去想都不敢想的梦想,在这些梦想的基础上,我们能够构建一个完美的商业环境和一个更加现代化的社会。
比如:美国的毒品问题,一直难以解决,因为大麻种植非常容易,甚至可以在自己家里种。如今,一些警察通过大数据来抓捕犯人非常容易。现在供电公司使用的都是智能电表,不仅能够记录电量还能记录供电模式。由于种植大麻房子的用电模式和一般居家不同,只要对比就能圈定一个犯罪嫌疑人。偷税漏税问题,税务局根据历史数据对每一类门店的收入和纳税情况进行分析。如果一家餐馆的营业面积和其他各家差不多,但是纳税和其他家相差太多,就会被调查。
塔吉特(美国零售商)利用大数据的故事非常有代表性。它们根据用户的数据向用户邮箱发送优惠券信息。有一天,一名男子闯入商店,说自己才上高中的女儿收到一些优惠券都是一些婴儿的衣服,摇篮车类的。你们这是在鼓励她早怀孕吗?于是经理致歉这位男子。几天后,经理专门打电话道歉,令人吃惊的是,那位男子说:我和女儿谈过了,家里的一些事情我并不知道,她真的怀孕了,预产期是8个月,我应该向你道歉。
如果依靠数据能够完全了解你,那么你还有什么隐私可言?
诸如亚马逊和阿里巴巴,就更可能比我们更了解我们自己的需求了。大部分人在逛网店的时候没有太明确的目标,这时候有针对性的推荐就变得特别重要。今天,亚马逊的个性化推荐不仅能针对个人喜好,也有较强的时效性。亚马逊能做到这一步,也是靠长时间大数据的积累。
普拉达Prada是意大利著名的奢侈品品牌。在过去它能否赢得人数并不多的消费群体喜爱,主要是看设计师的经验和专卖店的营销水平。不过,经验和营销水平常常靠不住。奢侈品时装销售好坏常常看运气。他们非常尽心尽力设计好一款产品,但是市场的反应如何他们完全不知道。在大数据时代早就有了答案,在2001年,普拉达开始利用IT技术提升销售。它们在商品的标签嵌入一个很小的RFID芯片。这是一种不需要电源的芯片,里面储存的信息可以被专门的阅读器发的无线电波探测出来。这个芯片可以客户正在感兴趣的商品和可能感兴趣的其他商品联系起来。他们还改造了试衣间,顾客每一次试衣服的记录都被保留下来,数据分析师,通过数据就知道这件时装卖的不好,是因为没有人注意到,还是试穿后顾客不喜欢。根据这些信息,公司就知道问题是处在设计和制作上,还是销路上。利用大数据,Prada的销售额从2001年的15亿美金,提高到2013年的40亿美金。同样有代表性的还有,Google的无人驾驶汽车等
在历史上,一项技术带动整个社会变革的事情也曾经发生过,他们通常遵循一个模式,即
新技术 + 现有产业 = 新产业
动力时代:现在有产业 + 蒸汽机 = 新产业
工业时代:现在有产业 + 电 = 新产业
信息时代:现在有产业 + 摩尔定律 = 新产业
未来/大数据时代:
现在有产业 + 大数据 = 新产业
现在有产业 + 机器智能 = 新产业
在信息时代,商业模式的变化更加明显,它突出表现在两方面,一是产业链从一种产品扩展到整个IT行业,二是服务业的重要性突显出来。在大数据时代,IT软件和服务业依然是IT领域最好的行业,而且这个趋势将更加明显。提供服务虽然不像销售产品一样一次能挣很多钱,但是细水长流最终会给这些服务提供者带来更长久的生意、更多的利润。
小米公司是一家产品单一、仍然在亏损的“电器”企业,但是却被国际上知名的风险投资公司估值为450亿美元。与此同时,手机出货量和小米想到,个人电脑全球占有率第一、连续多年盈利的联想公司,市值只有100亿美元左右,为什么会出现这样奇怪的现象。这个价值就体现在大数据上。从本质上讲,手机只是小米获取用户的手段,在获得用户之后,它需要通过其他方式赚钱。
事实上,很多数据是大家不在意的时候被收集的,比如各种传感器产生的数据,包括摄像头、可穿戴设备、手机GPS、以及采集声、光、热和运动的传感器等。我们每天携带手机,苹果公司就可以把每个苹果手机用户的出行路径记录的一清二楚。这列数据总量之大远远超出常人的想象,比如像每天北京和上海这样千万人口的大都市,摄像头数量超过10万个,如果每个都是每周7天,每天24小时监控,每个城市产生的录像时长高达每分钟1700小时以上,是YouTube的6倍左右。比如我们通过录像识别违章的车牌号,因此存储了大量的监控数据,我们存储的数据总量陡然就增长了,仿佛是从地下冒出来的。从这可以看出,大数据兴起的第二个必要条件就是存储技术的发展。
今天,第四代LTE的有效传输效率高达2MB/S——10MB/S。同时,WIFI覆盖率非常高,蓝牙成为许多设备的标配。这才使得数据在产生后可以迅速传到服务器上。
有了足够的数据处理能力,信息处理的速度也是大数据的先决条件之一。应用大数据的一个前提技术好一个大的计算机任务分到很多便宜的服务器上去做并行运算。单一维度数据的处理不难,但是大数据有多维特点,有时并行是很难的。直到2002年Google等公司陆续解决。与此同时,云计算开始兴起。通过互联网、廉价的服务器以及比较成熟的并行计算工具,实现大规模并行计算,大数据处理成为了可能。
大数据应用的一个挑战来自对数据安全的担忧和对隐私的诉求。过去各种防范方法,虽然防住了大多黑客和数据偷盗者的入侵,但是总有漏网的,大数据时代,数据量巨大,数据一旦丢失,损失也是巨大的。2013年塔吉特连锁数据丢失造成损失1.6亿美元。2014索尼损失1亿美元。TJ Maxx损失2亿美元等。比商业损失更大的是医疗记录被盗。一个医疗记录卖家是个人商业数据的50倍左右。
另一个挑战是个人隐私。我们每一个人都不是完人,或多或少都有不光彩的一面,如果被熟人知道了,对生活影响很坏。比如,艳照门的几名主角,收到的负面影响是一生的。如果提供服务的公司无限制,无节制的手机用户的数据,实际上每个人的行踪都可能暴露之大众面前,这是非常危险的。现在很多公司已经具备了这样的能力,只是大家不知道或者不在意而已。
不只是特斯拉一家公司在获取车主数据,96%的新车都具有类似的功能。社交网络和APP的提供者不断测试用户的暴露隐私承受底线,只要用户不抱怨,他们就做得越来越过分。比如,一款手电APP要求访问移动互联网的所有联系人的信息时,它要访问的信息和它提供的功能完全无关。
人们在某些大型电子商务网站上发现,某些人总是买到家伙,另一些人以同样的价格却买到真货。这并不是前者比后者运气差,而是商家掌握了太多的个人数据。美国很多航空公司都在利用个人隐私大发其财。如果某个询票者最近必须旅行,而且过去对票价不是很敏感时,它给出的报价就会比其他人高很多。
我们必须清除的认识到,保护好隐私对大数据的长远发展非常重要。一种保护隐私的技术是双向监视,如果有人刺探别人隐私时,他的行为本身也暴露了,那么他多少会约束自己。
如果 两家公司同样挣钱,一家有能力保护用户隐私,另一家总是侵犯用户隐私,可以想象,后者会逐渐丧失,用户。
在过去,解决土地短缺问题的方法是施用化肥和农药增加单产,解决水资源问题的方法是挖更多的井抽水,但这实际上是将短期矛盾转化为长期的危机。
以色列降水极少,年降水量200毫米,占土地面积一大半的南部内盖夫沙漠,年降水25-50毫米。但是奶牛单产奶量世界第一。棉花单产世界第一,亩产1000斤。柑橘亩产3吨(中国0.5吨)。这个干旱的沙漠还是第二大花卉供应国。靠的是科技兴农(前一段时间看《十三邀》,王石最近就在以色列学这个,估计未来也会引入中国)。以色列发明了滴灌技术——装有滴头的管线直接将水和肥料送入植物的根系,大大节约了水和肥料。所有滴灌方式都采用计算机进行自动化控制,灌溉系统中有传感器,能够通过检测植物茎果的直径和地下的湿度,来决定植物的灌溉量,这样可以节省人力和水资源。由于大量传感器采集数据,这种自动滴灌系统可以对水量和产量的关系进行学习,改进滴灌量。
引入机器智能之后,农业这个人类最古老的产业将会以崭新的形态出现。
2015-2016,金州勇士队创造NBA历史上常规赛获胜了最高的记录。2009年,它的成绩还是倒数第二,它创造的奇迹在体育史上是独一无二的。金州勇士队的成功因为它处于一个特别的区域——硅谷。硅谷最不缺的就是两种人,风险投资人和工程师。前者善于看到其他人没有发现的潜力,然后把它经营成值钱的实业;后者善于利用技术创造奇迹。勇士队的成功就是他们合作的结果。他们的秘密武器,就是应用了大数据工程师。6年前,勇士谷底,一些风险投资人把这支不值钱的球队买下来,在管理层的背后,一个工程师利用大数据制定球队的发展战略和比赛战术。把球队的明星卖掉,围绕一位毫无名气的球员重新制定球队的风格和战术。
根据数据分析的结果,管理层认为现在NBA说追求的打法是低效率的甚至是错误的。这位新人是史蒂芬库里,他身高只有1.91,09年以很便宜的价格被签约,但是因为他有一个特长投篮精准。
2014年科尔执掌勇士的时候他没任何执教NBA经验。但是,他坚持用数据说话,而不是凭经验。他根据背后团队对历年来NBA比赛的统计,发现最有效的进攻是眼花缭乱的传球和精准的投篮。在这个思想下,勇士队苦练神投技。在对手防守库里的时候,汤普森则大发神威。同样利用大数据的场景还出现在排球、高尔夫、网球等项目。
未来竞技体育是离不开大数据和机器智能的。但是仅靠天赋和苦练将不足以取得最好的成绩。
未来制造业将逐渐采用机器人取代装配工人。新型汽车公司特斯拉,已开始尽可能使用机器人取代装配工人。它的一个巨大的优势是,产品容易按照个性定制。
大数据也在改变医疗行业,医疗成本高是一个很常见的问题,原因是因为药品的研制周期太长‘费用太高、以及医务人员的成本太高。而今天智能识别软件通过医学影像的识别和分析,可以比有经验的放射科医生更好的诊断病情,这将从根本上改变医疗行业的现状。老大夫学习再快也学不过计算机。美国一位高中生通过对760万乳腺癌患者的样本数据,设计了一种确定乳腺癌细胞位置的算法;达芬奇手术系统可以远程操作手术,手术创口小,而且能实施一些人类很难完成的手术;IBM开发的沃森已经达到了中等医生水平。不久的将来,计算机在一些疾病的诊断方面会超过人类。同样在治疗癌症方面,大数据也有巨大突破。计算机也会取代部分律师,记者,编辑等工作。
“这是最好的时代,也是最坏的时代”
机器越来越多的占据我们人类的工作机会,这个过程一开始是悄无声息的,但是当发展到一个拐点,我们就会发现这个趋势将不可逆转。大数据可以智能化社会、精细化社会、追踪每一次交易、提供标准化到个性化的服务。但也会带来一个无隐私的社会。
在大数据时代,如果真有一个老大哥想要监控每一个人,其实是可以做到的。
每一次重大的工业革命都需要很长时间消除他的负面影响。技术革命会带来很多产业的消失。或者产业从业人口大大减少,释放出来的劳动力需要寻找出路。这个时间多长呢?至少一代以上,我呢必须承认一个并不愿意承认的事实,那就是被淘汰的产业的从业人员能够进入新行业的其实非常少。对那些曾经做过贡献的,但已经被技术革命淘汰的员工,唯一的希望是他们的后代能够进入一个新的行业。这实际上是靠时间慢慢地消化技术革命带来的负面影响。
我们必须回答一个问题:当全社会各行各业的从业人数都因为机器智能而减少时,全世界几十亿的劳动力怎么办?
1900年,美国东北部的波士顿地区的人只要有一份工作,就能在波士顿市内或者查尔斯河对岸的坎布里奇买一栋连排别墅,今天,哪里的人需要一份非常好的工作,才能买得起同样的住房。苹果公司全球只雇佣了8万名员工而已。进入Google公司要比被哈佛耶鲁难得多。
那些淘汰下来的劳动力怎么办?新毕业的学生如何就业。但是要么去从事一份工资足够低的服务性工作,要么靠领救济金过活。
在智能时代,一定会有一小部分人参与智能机器的研发和制造,这是所谓的新行业,但是这只会占用劳动力的很小一部分。
其实社会的公平只能反映在机会的平等上,而不是结果的公平。实际上,只要个人的智力有差异,努力的程度不同,以及每个人的运气不同,即使劫富济贫,也无法保证社会公平。
任何一次技术革命,最初受益的都是发展它的人,使用它的人,而远离它,拒绝接受它的人,在很长的时间里都将是迷茫的一代。在智能革命到来之际,作为人和企业无疑应该拥抱它,让自己成为那2%的受益者;而作为国家,则需要未雨绸缪,争取不要像过去那样每一次重大的技术革命都伴随半个多世纪的动荡。
我们还没有经历过机器在智能上超越人类的时代,我们需要在这样的环境里学会生存。这将是一个让人振奋的时代,也是一个给我们带来空前挑战的时代!
读完吴军老师的《智能时代》,感概万千。吴军老师能够接触到很多前沿的科技,拥有更广阔的视野。我们读这本书则会看到更广阔的世界。
这本书向我们提出了一个问题:如果革命即将到来,我们将何去何从?
值得深思。