浅谈大数据之大?

如何理解“大数据”的“”?


大数据时代的到来,数据科学在IT行业的发展中蒸蒸日上,每当人提起“大数据”一词的时候,可能我们的最直观理解就是:大数据不就是海量数,更直白一点就是数据的数目多,数量大。可是“大数据”的“大”就仅仅体现于此吗?其实这样的理解是片面的,这个“大”可能比你理解的“大”大(有点绕口),而且还大了很多。


那么怎样理解这个“大”呢?

我们不妨在百度的搜索引擎上就输入一个“大”字,它的解释是大致是这样的:

大,是汉语通用规范一级汉字(常用字),读作dà、dài、tài,此字始见于商代甲骨文及商代金文 ,本义是容量、体积、面积、数量、力量、年龄等方面超过一般或超过所比的对象,与“小”相对,后引申出“范围程度深广”、“年辈较长”、“再”等意义,又作为敬词来使用。

和我们平时了解的“大”差不多,但是我们总可以在这个解释中提炼出不少的东西!

  • 数量大:这是我们最直观的理解,就是数据多,数据越多,就越具有说服力和表现力,这里就不赘述了。重要的是下面三点!!!
  • 维度大:从哲学角度看,人们观察、思考与表述某事物的“思维角度”,简称“维度”。例如,人们观察与思考“月亮”这个事物,可以从月亮的“内容、时间、空间”三个思维角度去描述;也可以从月亮的“载体、能量、信息”三个思维角度去描述。也就是说数据本身是具有不同的维度的,从不同的维度出发,也可以说是从不同角度对大量数据进行分析,往往会得到不同的结果。每一个结果都可能反应一种现象,更深层次的会体现被研究事物的本质。

  • 变化速率大:大数据还有一个特点,那就是时效性。从数据的生成到消耗,时间窗口非常小。数据的变化速率,还有处理过程,越来越快。例如变化速率,从以前的按天变化,变成现在的按秒甚至毫秒变化。
    我们还是用数字来说话:
    就在刚刚过去的这一分钟,数据世界里发生了什么?
    Email:2.04亿封被发出
    Google:200万次搜索请求被提交
    Youtube:2880分钟的视频被上传
    Facebook:69.5万条状态被更新
    Twitter:98000条推送被发出
    12306:1840张车票被卖出
    ……
    怎么样?是不是瞬息万变?
  • 价值大:有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是赢得竞争的关键。近年来,数据挖掘成为了数据科学的一个非常重要且火热的分支,简单的数据分析只能反映数据表面的特征,体现的价值不是很大。而数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程,这里面的数据价值往往是我们最想要的,因为他的价值更大,更有用,对事物发展更具有决策作用。

这样,这个“大”我们理解的就差不多了,这里的差不多其实还是差了很多,想要更深层次的理解大数据,就得去接触数据科学这一缤纷多彩的学科了,而这往往是山遥路远,任重而道远的!!!

你可能感兴趣的:(拙见,大数据)