数据迷思

数据走进我们的视野,文科的领域。自从经济学成为人文社科的显学以降,数学工具便一再重塑我们的思维格局,而如今的数据,指的是用户使用互联网留下的“痕迹”,仍然是量化思维的胜利。我们无力抗拒,唯有接纳。
幸好,我们还有数据分析的能力,数据获取和数据分析是两种思维路径,前者特指如何从各大网络平台留存痕迹,而后者,则是从痕迹中寻找我们希望的东西,而对于超出现有分析工具能力以外的结果,我们无力去认识。比如Excel和SPSS的能力界限就是我们的能力边界,一步雷池难越!
我们有成为数学工具的奴隶的可能,因为出于种种原因,我们很难去“理解”工具,仅仅是“应用”工具,我们没有能力去对工具做出修改,而只是沿着工具的路径去一次次重复,因此,所谓的“数据获取”只是一句空话,我们的目的是无关紧要的,工具的能力束缚我们的想象力,比如“爬虫和反爬虫”,这是一场旷日持久的斗争,久到很多人都忘了前一秒的数据的时效性其实只有一秒,海量数据的持续产生,让研究数据日益失去意义,你慢一秒,爬虫可能失效,反爬虫措施会出现,只是近似,精确度随之下降,时间,终究战胜了蠢笨的能力边界。
在以上条件的限制下,我们还有一条“出路”:数据分析。时效性依旧不能保证,但至少分析者是有限的,数据依旧是值得付出的。互联网没有改变什么,除了让我们把痕迹一点点留下来以外,分析能力依旧是大多数文科生缺乏的核心能力,发问卷、回收问卷,导入SPSS,然后就没有然后了。
未来依旧是属于有能力去掌握数学工具的人,大数据有它对应的“小数据”吗?没有,只有对应的零散数据,大数据是经过整合的“结构化”数据,绝非海量的意思,那是最为表浅的特征,而且你不可能不去产生数据。你可以不上网,但你要出门,在互联网发展到移动互联网,再至物联网的阶段,出门的摄像头,从天空到地下遍布的传感器,你已经被数据裹挟,很遗憾,这个世界就是这样的,大数据在捆绑你的生活,你无处可逃。SPSS根本上是没有深度分析这些痕迹能力的,如前所述,你需要更为深刻、更为本质的数学工具:编程语言。无论是Python,亦或R,还是Go等语言,拥有强大的“易用性”,我们需要他们,就像我们接纳激光照排技术一样。
不必恐惧,从新闻业开始,这种淘汰与新生便一直存在,从纸质承载文字,到加上图像,再到音视频,摆脱的只是过往,还有新的工具等待我们,我们是无比强调实用的学科,接纳它,数学工具以编程语言的面貌出现,已经是友好的局面了。
如果不接纳,就必须被毁灭,这个世界就是这个样子的。

你可能感兴趣的:(数据迷思)