如何避免数据迷信?

今天听TED,讲到大数据。这是一个我蛮感兴趣的话题,特别是看了三部简史之后。大数据似乎能操纵一切事情,物流,电网,互联网,基因编码,交通,尽管你不愿意承认这一点,或许还没有意识到这一点,但它确实已经覆盖了人们的生活。大数据就完全正确吗?它相对科学,能量化特定环境,最可靠的是它是确定的。充满不确定的人总是对确定的东西格外信任。然而不是所有体系都是可量化可控的,人这个体系就是最不好量化的,它复杂多变,在科学的实践中往往忽略自己这个实验主体,造成一些数据缺失。

演讲者Tricia  Wang 提出一个新名词“厚数据”。厚数据的数据源恰恰来自于多变的人类,包含理解人类生活的过程。比如说最底层人民对手机的狂热,人们看连续剧喜欢连续看(大数据往往只会分析人们喜欢的电视剧类型),这个发现帮助netflix大获成功。这些都是大数据覆盖不到的角落,它们样本量小,却能传达意义重大的信息。若能将大数据与厚数据很好的结合使用,我们能得到更好的数据,做出更好的决定。

毕竟科学不是目的,人才是目的。

你可能感兴趣的:(如何避免数据迷信?)