作者:Praveen Asthana戴尔解决方案副总裁

源自:Big data and little data

IT界最近的一个热门词是“大数据”(big data)。这是什么意思呢?它与“小数据”(little data)的不同在哪里?它会成为下一个大事件吗?我们对它应有所敬畏吗?

事实上,大数据就在我们身边。分析它,能够提高一切事物的性能,包括从游戏到汽车。Farmville(风行美国的梦幻农场游戏)就是一个很好的例子。每一天,Farmville的制作公司Zynga都会对大量的数据开展广泛的统计分析。该公司具备全世界最大的数据仓库之一,而这对于他们来说也恰如所需。其游戏每天生成超过15TB的新数据。(1TB等于不列颠百科全书的1000份拷贝。)Zynga的目标是鼓励玩家行动起来,保持对游戏的兴趣,改进财务转换——游戏中的种种元素可以换成真正的钱。

为了实现目标,Zynga充分利用了对玩家行为的持续数据分析结果,以便于测试和调优游戏中的特性。这种做法将该公司推上新兴领域“大数据分析”的前沿。“大数据分析”即对大规模数据开展分析,以便于收获智能化的预见性。不错,Zynga将自己称之为“掩盖在游戏公司身份之下的分析公司”。

另一个通过大数据分析赢得巨大优势的例子是沃尔沃。这家瑞典汽车制造商从其汽车的内置传感器、客户关系管理(CRM)系统、经销商、汽车工厂收集以TB计的数据。各种来源的数据流被合并起来进行分析,从而产生早期预见性信息,例如尚未发生的制造缺陷。所有垂直行业都能从分析中获益,而有的行业获益尤为显著。McKinsey & Co.预测零售链可通过分析将利润率提高60%。沃尔玛是该领域的先锋,在大数据分析流行之前很早就已实施。

那么大数据与普通规模的数据有何不同?

大数据指的是大量的数据,往往包含数百TB甚至PB级(1000TB)的信息。它通常以非结构性数据的形式出现,并且包含彼此无联系的数据集,例如来自各种各样独立数据流的片段,例如社交媒体、CRM、调查结果、人口统计数据、缺陷评定等等。这一点上,它不同于传统的数据集,因为传统数据集往往是彼此相关的。大数据分析的另一个重要方面是分析速度,其分析非常快速,甚至能实时出结果。

大数据分析常常突破传统数据库和分析流程与体系的界限。数据集可能太过巨大,彼此无联系,并且需要极其快速地加以分析。为了适应其需求,一个新行业应运而生,基于的是新兴技术(例如Hadoop Map Reduce)、 “R”统计语言,以及全新的高性能基础架构解决方案(包括并行多处理、高速网络、快速IO存储)。不仅如此,大数据分析还需要一批经验丰富的工作人员:数据科学家,甚至数据艺术家。有些公司还设置了“首席分析官”的职位。

但是,要从分析中获益,您不必加入“PB俱乐部”。无论大数据多么受追捧,事实上大多数组织可从普通规模的数据(几个TB)甚至“小数据”中获得洞察力。就拿当前的一部电影《点球成金》(Moneyball)来说。该片根据Bill James的真实故事改编,他从棒球比赛中分析统计数据,寻找模式,从而为奥克兰A’s棒球队制订了制胜策略。他所分析的数据集相比大数据集甚至正常规模的数据集堪称微小,但这并不妨碍其生成关键性的信息,帮助奥克兰A’s击败众星云集的其他球队。

所以说关键不在于“大数据”,而在于“大洞察”。其实整个大数据领域应该改名为“大洞察”,因为正是洞察力(可以从任何规模的数据集获取)帮助您更好地服务于客户、赢得竞争。应该问的是:您的组织从数据中萃取洞察力的成效如何?

更多精彩文章请关注:

戴尔技术社区