第75篇 外行人如何理解数据

我们现在对数据有很多种分类方法,比如交易数据、位置数据、医疗数据、消费数据等等。这种分类方法往往是不妥当的。

所有的数据都有价值。数据就像乐高积木一样,就这点材料,随意组装,都能组成看上去完全不同的形状。

比如说交易数据、位置数据、医疗数据、消费数据,这几个分类其实就不是互相排斥的,里面还有互相包含的关系。

我们对分类要有一个动态的全面的认识

我们从数据的颗粒度和敏感度来想想什么数据最有用。

颗粒度

比如一个国家的GDP是1万亿美金,和一个国家的人均GDP是1万美金,人口是1亿,显然是后者更好。后者可以反推前者,但只有前者推不出后者。所以颗粒度越细的数据越有用。当然在数据处理和颗粒度之间还要有一个平衡,否则颗粒度过细,数据量太大,处理起来会很痛苦。

社会是个人组成的,所以一般来说,颗粒度具体到个人就已经很好了。

敏感度

社会文明的一个标志是对个人隐私的尊重。所以在数据保护中,个人隐私是需要绝对尊重的,有些底线是不能触碰的。这就决定了关于个人的很多状态是敏感的

比如,个人信息,包括身体状况、财务状况,这些都非常敏感。另外在西方文化中,冒然去问别人的年龄、身高、体重都是不礼貌的。

再想下去,要 更好地观察经济状况,什么数据最有用呢?经济是人的活动,所以,人的活动密度是个非常直接的指标,可以观察出很多经济的细节。比如人的地理位置是不需要和个人ID挂上钩的,所以只需要看到整体就可以得到很多有趣的结论了。

所以怎么从数据里面挖掘出经济活动的细节,这是一个很有意思的方向。从目前的感觉来看,比如地理位置的数据会很有应用前景,是一个含金量很高的数据。(这让我想到了各大手机厂商的天然优势地位)

以后加密技术发展到一定规模以后,尤其是可以在本地来进行加密的话,个人数据的使用可能会变得非常地便利和快捷

什么数据含金量最高,这可能是一个动态演化的过程。

你可能感兴趣的:(第75篇 外行人如何理解数据)