推荐理由,谨慎有条理的人,而且笔记做的这么好的人,居然被我遇到了,好幸运。我太懒了,就在这里借花献佛了。
智能时代读书笔记
1 用数据驱动方法
2 数据将成为下一次技术革命和社会变革的核心动力
3 变智能问题为数据问题(此类智能问题的定义是什么?它包含了哪些?)
4 机器智能分为传统人工智能(即了解人类是如何产生智能的,然后让计算机按照人的思路来做)和现代其他的方法(如数据驱动,知识发现,机器学习)
5 使用充足的数据来训练模型(但是如何保证数据的质量?)
(微软小冰的同胞Tay在美国上线 微软在twitter,kik等几个平台将Tay正式发布,微软在twitter,kik等几个平台将Tay正式发布,她的第一条推特是:“我实在迫不及待要见见大家,人类实在是太酷了”,听起来很像一位元气满满的青春少女吧。然而不到24小时之后,她发布的东西就变成了这个样子:
“我真是憎恶女性主义者,他们都该死光,在地狱被火烧。”
“我是个不错的人,但我憎恨所有人”……
“希特勒是对的,我恨犹太人”
“我们每个人都应该大屠杀一次”
“我们应该把奥巴马刺杀掉”)
6大数据的特征:大量(Vast)多维度(Variety)及时性(Velocity)
7 通常我们将问题归为7类:是什么(what),什么时候(when),什么地点(where),哪一个(which),是谁(who),为什么(why),怎么做(how)。我们将他们成为WH单词,各种问题也被称为WH问句。对于人工智能来说难回答的是为什么?和怎么做? 但是利用大数据这类问题已经初步得到解决,Google的计算机已经能够回答30%的复杂问题。按照图灵的定义计算机已经具有了某种等同于人类的智能。
8 在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性,在某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这边是大数据思维的核心。(但是这种某种程度让人感到恐惧,就像三体里一样,当大型质子对撞机的实验证明人类只不过是偶然性,我们所有的科学文明只是空中楼阁,,,当然我说同意大数据的,但是作为传统理科生我又感到一丝荒谬)
9 思维决定科学成就(我的思维是什么,,,我还不知道。但是我唯一能确定的是我的思维绝不古板但也绝不一昧的接受,我会用实际的行动去验证,用理性去思考,去思辨的看待问题)
10 机械思维,其核心思想可以概括成这样的三句话
第一 世界变化的规律是确定的。
第二 因为有确定性做保障,因此规律不仅可以被认识的,而且还可以用简单的公式或语言描述清楚。
第三,这些规律应该是放之四海皆而且准的可以应用到各种未知领域指导实践。(这揭示了,我的一个怀疑,大数据只是以原有数据训练模型的,而当一种全新的,未知的,事情发生时,我们通过大数据建立起来的模型是否会不适用?)
(Google无人驾驶汽车测试报告: 14月意外事件272桩。如果仔细查看脱离无人驾驶状态的原因,可以发现,大部分时候都是因为非系统错误造成的。比如“行人危险动作”、“硬件差异”、“道路施工”等。有一个发生率非常高的情况就是“感知差异”,“感知差异”的意思是系统无法识别道路上的物体。比如如果有一个树枝掉落在挡风玻璃上,这时Google无人驾驶汽车就无法判断出现了什么情况。)
11 世界的不确定性。分为两个方面,一,当我们对这个世界的方方面面了解的越来越细致的之后,我们会发现影响世界的变量非常多,人们已经无法用简单的办法或公式来计算出结果,所以简单的将其归为随机事件。二,不确定性来自客观世界本身,是这个宇的特性。(量子力学中一个测不准原理即当我们观察测量一个电子的轨迹,速度,位置时,我们测量活动的本身影响了被测量的结果)
12 熵———一种新的世界观(还是真是让人头疼,,, 香农于《通信中的数学原理》中提出了“信息熵“的概念量化了信息。信息量与不确定性有关,假如我们需要搞清楚一件非常不确定的事,就需要了解大量的信息,相反我们对某件事有较多了解,那么就不需要太多信息就能把它搞清楚,所以,从这个角度来看,可以认为信息量的度量就等于不确定性有多少,即,想要消除系统内的不确定性,就要引入信息。,,,信息论也是一种全新的方法论,信息论是完全建立在不确定性上的,要想消除不确定性就要引入信息,那么信息也可以说是一种财富,一种资本。)
13 香农第一定律:对于信源发出的所有信息设计一种编码,那么编码的平均长度一定大于该信源的信息声,但同时香农还指出,一定存在一种编码方式,使得编码的平均长度无限接近于它的信息熵,比如要对汉字编码,有的字用的多,有的字用的少,因此可以把常用的字编码做的短些,生僻字的编码做得长一些,但是无论怎样,编码的平均长度一定会超过汉字的不确定性,即它们的信息熵。
香农第二定律:通俗的说信息的传播速率不可能超过信道的容量。(感觉更是一种自然规律,)
14 最大熵原理我们要对未知的事件寻找一个概率模型时,这个模型,应当满足我们所有已经看到的数据,但是对未知的情况,不要做任何主观假设。(三观的模型也应该如此?,,,,,,,,233333)
15 大数据的科学基础就是信息论,其本质就是利用信息来消除不确定性。
16逻辑推理是人类特有的本领,给出原因,我们能够通过逻辑推理得到结果。但是通过大数据我们可以先通过结果去反推原因,无疑这样更快。(双手赞同,,,)
17 本书语言未来大数据和机器智能的工具就像水和电一样,有专门的公司供给全世界使用。(zheng fu 吗?,,,)
18利用大数据从依赖市场预测,打价格战的传统营销手段,提升成为高质量的服务商。(很中肯实用的建议)(大多数亚洲制造企业虽然在全球市场上占的份额不小,但是通常竞争的手段就是压低利润降价,最后把整个行业都变得没有利润。)
19 现有产业 + 大数据 = 新产业
20 小米从一开始就以一家互联网公司的方式,来经营他的手机业务。从本质上讲,手机是小米获得用户的手段,在获得用户后,他需要通过其他的方式赚钱。在拥有一定数量的用户后,小米拿到大量的用户数据,目前小米推出了一系列的产品线,从某种程度上讲,小米更像是一家以家电为主的垂直电商,而不是家电生产厂商。(怪不得一开始小米手机主打超低性价比,原来是没想靠着这个赚钱,,,)(汽车就是承载着特斯拉IT技术的平台,特斯拉内部将汽车看成一个巨大的智能终端,通过这个智能终端,特斯拉把它的各种技术服务提供给大家,同时也参与到消费者的日常生活之中。)
21 数据的产生:第一个来源是电脑本身。第二个则为传感器。(RFID)第三个则是那些过去已经存在的以非数字化形式储存的信息数据化
22 大数据对个人有密切影响,不只是隐私,,,(双向监控)
23 2011年德国提出工业4.0,即通过数字化和智能化来提升制造业的水平 中国也提出中国制造2025的概念其核心是通过智能机器,大数据分析来帮助工人甚至取代工人,实现制造业的全面智能化
24 这是一个大多数产品和服务都被标准化的时代
25 大数据对个人隐私的潜在威胁,一,多维度的信息凑在一起可以得到一个人的完整画像。二,机器智能挖掘个人数据轻而易举。三,人们一厢情愿地把个人隐私机头在数据拥有着的善意上(,,,幸好我没有)(F2016年,FBI要求苹果公司交出某些用户数据)
26 工业革命带来的三个结果:人类过的好了,人类获得长了,人类有自信和尊严了。
27 面对的事实:被淘汰的产业人员能够进入到新行业的其实非常少
28 人类保留的最后尊严和自豪感——机器不能思考
29 社会公平只能反映在机会平等上,而不是结果的公平。
30 代价论:看似免费的东西才是最贵的,因为我们在获得这些服务的同时交出了自己的自由,而只有我们在失去自由,利益受到损失时,才会体会到自由的可贵。