Big Data 读后感

惯例来从自己摘抄的话来谈读后感。

1，不再追求精确度，不再追求因果关系，而是承认混杂性，探索相关关系。

放弃对因果关系的渴求，很喜欢这个概念。而人们通常理解范围里的因果关系，也常常是病态的，总是两件事先后发生，便强加“因果关系”于它们。这也是GRE阅读里极易犯下的错误。甚至在八卦新闻里，也是如此。人们总是不知疲倦地挖掘事物之间的因果关系、先来后到。殊不知，有那么一点相关已经足够，再放到大数据的时代，在全局观下，关注相关关系节省精力，cost-effectivly.

2，量变导致质变。

e.g. 纳米技术关注把东西变小而非变大，其原理就是当事物达到分子级别，其物理性质就会发生改变。金属可以变得柔软，陶土可以具有弹性。同样，我们增加所利用的数据量，就可以做很多在校数据量的基础上无法完成的事情。

这句话本身就曾经作为过我自己的人生准备，但是书中这个具象的例子还是让我更加增添了几分喜欢。当被确定的变成了不确定，这本身就是一件很好玩的事情。

3，技术成熟曲线（技术循环曲线）（炒作周期）

很喜欢提取型名词，这个名词用来形容大多数市面上电子产品的运作模式都不为过。而相反从用户的角度来考虑，一开始新技术被大肆炒作，用户却容易唱反调，保持观望态度。等到平缓期，褒贬不一，愿意相信铁粉去尝试的人发现甜头，又会让它热起来。当然个体有差异。

4，采样分析的精确性随着采样随机性的增加而大幅提高，但与样本的数量的关系不大。（类似经济学中边际效应-递减）

说实话人类那么酷爱研究A增B增，A减B减，最后还是得无可奈何承认它的大范围和一定局限性。

5，执迷于精确性是信息缺乏时代和模拟时代的产物，只有5%的数据是结构化且适用于数据库的，如果不接受混乱，剩下95%的非结构化数据无法被利用，只有接受不确定性，才能打开新的窗户。

再一次完美契合我的“设计随机论”的观点。这段话很容易让我联想到大学做物理实验，我的物理天分不高，做起实验来也东倒西歪，通常只要得出一个数据就万事大吉。现在想想统统都是在制造混乱，好险最终没有走精准的科研路线，否则统统都是把结果引上一条不归路。

而对于信息而言，本身就是没有对错的，大多都是人为设定的，“我想要的数据的样子”，等到了最后，却没有人去验证和讨论“我想要的”这个前缀是不是有太多偏执。总之太多的“要果造因”，再“因”一出来print\print\print作为后续一堆莫名其妙的参照源头。这样下来，尽管信息是没有对错，却人为地给制造出来了对错，再被现在充满戾气的网络民众所利用，就更加面目全非。

6，If you have too much data, then "Good Enough" is Good Enough

人们就是喜欢追求看不见的，却不把握手中已有的。在高频率信息流的冲击下，无需人工关联以及建立飘渺的假设基础。总是现有的就是好的，全部一起用上吧！

再深之剖析人类思维模式：

A-不费力的快速思维，几秒得出结果，通过已有知识和信仰的执着

B-比较费力的慢性思维，特ing问题考虑到位

人们就爱A，而A其实就是思维惰性，也就是无论考试中错题，生活中误会所贯穿的“想当然”。

7，“病毒型社交”“数据废气”“数据折旧值”“可扩展型数据”

这些都是非常好的名词，作为名词控深深M一下。

8，卓越的才华并不依赖数据。

这句话非常好，并借用interactive design课上老师做的分类：

User-Centered Design/Activity-Centered Design/System Design

/Genius Design

其中Genius Design就是这个道理，relies on skills and wisdom of designer。通用例子苹果公司。乔布斯没有市场调研就是因为他知道“消费者没义务去了解自己想要什么。”以及亨利‘福特那句“如果我当年去问顾客想要什么，他们肯定会告诉我，一匹更快的马。”

当然这同样是需要辩证的在现实当中实践。

总的来说，虽然这本书没有看英文原版，但是还是收获了很多。这个贯穿的主核心也很好理解，就是全局观念去处理分析数据，而不是设限地为了数据而数据。Just Let it Flow~

Big Data 读后感

你可能感兴趣的:(Big Data 读后感)