碎碎念-大数据

碎碎念-大数据_第1张图片
大数据?!

Cute baby--你的文章,动机在哪里,为何将会吸引人?
Wolf--将要提出的问题。对Cute baby(动机)动机有何(不良)影响(从而需要解决)?
Silver bullet--你想如何解决,能解决到何种程度。(kill;injure;separate)

--How to write/present science: BABY-WEREWOLF-SILVER BULLET

  • Cute Baby

网络带给了我们什么?这是一个让人很迷惑的问题。当网络变得越来越为人熟知的这几十年,对于这个问题的答案却变得越来越陌生。数学、物理、经济、心理甚至政治科学,都能给与这个问题不一样的回答。但无一例外的收获是,网络丰富了各个学科探究该学科基本问题的便利性。这种便利性至少从获取数据和处理数据上,是可以体现出来的。对于自然科学来说,网络赋予了更强大的沟通与分布式处理能力;对于社会科学来说,网络则更是在获取数据上体现出了独特的优势。

随着各类数据在各个企业、高校和研究机构的累积,过去的数据资源从数以吨计的纸质资料,转化为了以PB为单位的电子资料,并且这种积累还在呈几何级数上升。以Facebook在2014年的数据为例,该年份其累计存储量超过了300PB,并且以每日600TB规模,加速上升。我们应该可以很容易的发现其他各大机构的数据累积,都会呈现着类似的状态。在互联网的帮助下,人们获取数据的能力,得到了史无前例的提升。

如此巨量的积累,让人着迷,也让人迷惑。过去,当纸张与其他工具普及以后,人类纸质书籍的积累,与知识的积累似乎呈现出了相当大的关联性。对个人而言,藏书与阅读,也可作为知识丰富程度的标志。数据的积累,无论是科学数据,还是生活数据,就如同过去纸质的资料与书籍一样,在互联网的帮助下,呈现着当年的暴增趋势,但这是否也能遇见着知识的暴增?同时,在传统的研究方法下,我们所需要做到的数据收集与文献综述,是否在网络的应用下,已显得不再重要,我们只需几次点击,就能做到过去的一切呢?

答案是否定的。各个或大或小的数据节点,就如同过去规模各异的图书馆以及企业、个人等数据载体一样,并非是数据的直接获取来源。我们所见的,并非就能是我们希望得到的。或者至少,等待我们的更好结果,依旧藏在数据之中。变化的,只是数据的载体,以及数据的节点权重而已。

就如同过去的研究工作一样,我们需要从研究对象身上获取研究数据,我们采取谈话、调查或查阅的方式。现在的研究工作,尤其是建立在大数据载体的研究工作,我们同样需要这些过程,只是用了不同的接口。但目的是一样的,便利与综述,让数据为我们所用。

  • To Be Continued...

你可能感兴趣的:(碎碎念-大数据)