大数据5v指的是什么?——以沃尔玛为例

Volume

大量的。大数据中数据的采集、存储和计算的量都非常大。那么大数据究竟要多大呢?正常的计算机处理4g数据需要4分钟的时间,处理1TB需要3个小时的时间,而达到1PB的数据需要4个月零3天的时间,起始计量单位只有达到PB的数据才可以被称之为大数据。

沃尔玛是当今最早开始投资和部署大数据应用的传统企业巨头之一,也因此从中获利。大数据使沃尔玛改变了重复销售的决策,这带来了10%到15%在线销售的明显涨幅,增加收入10亿美元。沃尔玛自己有一个庞大的大数据生态系统。沃尔玛每小时约有100万笔交易,大数据生态系统每天处理TB级的新数据,和PB级的历史数据,还需要分析数以百万计的产品数据、数以亿计的客户和搜索关键词。

 

Velocity

高速,什么又称之为高速?就上面的例子而言就处理1PB的数据不到1秒就可以实现,这就是高速,为什么要有高速,是因为数据也是有一个时效性的,超过了某段时间后,数据就会失去其作用和价值。数据增长速度快,因此处理速度也要快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。

通过社交媒体分析来提高运营效率和销售收入看起来非常诱人,但沃尔玛要完全完成这点还面临一大考验:社交网络中信息产生的数据流速度很快,也就是通常说的“快数据”,用传统的技术手段无法对“快数据”进行有效的分析。如今社交媒体是增长最快的的大数据源,像微博、Twitter这类的社交媒体产生的不仅是“大数据”还是“快数据”,具有很强的时效性。而为了解决这个难题,沃尔玛实验室开发出了特别的解决方案和技术,通过大规模的服务器集群对“快数据”流进行极其高速的处理。现在沃尔玛每天能处理数以十亿计的社交媒体更新信息。

 

Variety

就是种类和来源多样化。包括结构化、半结构化和非结构化数据。随着互联网和物联网的发展,又扩展到网页、社交媒体、感知数据,涵盖音频、图片、视频、模拟信号等等,真正诠释了数据的多样性,也对数据的处理能力提出了更高的要求。

就如前面所说沃尔玛也十分重视从Twitter、Facebook等社交媒体获取数据。并且在进入Web2.0时代后,相较于以往Web1.0用户被动地接受信息,现在主动权掌握在了用户手中,用户可以上传、分享自己的原创信息。网站和用户有了很好的交互。这也使得这些年来,网络数据量呈现出了爆炸式的增长。但是也是因为这些技术和思想的进步和发展使大数据涵盖了更多涉及方方面面的内容,丰富了大数据对数据的采集和获取的方式。

 

Value

就是获取有价值的数据。如果用石油行业来类比大数据分析,那么在互联网金融领域甚至整个互联网行业中,最重要的并不是如何炼油,而是如何获得优质原油。最重要的就是挖掘更多有价值的信息。因为大数据中数据价值密度相对较低,可以说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。

而沃尔玛很出色地对数据进行了挖掘和利用。沃尔玛每天有超过40PB的数据可供分析,在如此庞大的数据集中,有用价值的密度其实是很低的。但是沃尔玛运用一切技术提取信息,为企业在决策前将成本降到最低,并创造新的消费机会。

举个例子,小明是沃尔玛的老顾客了,而他在近几年购买商品的品种、数量、型号、时间信息、支付方式信息、商品配送信息、会员卡信息、住址、联系方式,甚至小明在沃尔玛商场购物的监控视频、门禁数据等线下消费信息都已经被沃尔玛的信息系统详细记录。那这些数据有什么用呢?

当小明来到沃尔玛商场时,他手机上的沃尔玛APP可能已经收到了来自购物清单中八成的商品信息和优惠券信息。当小明买好东西,用手机支付时,在移动支付完成的瞬间,沃尔玛已经在数据端开始更新小明的消费信息,并开始预判小明在下次购买某些商品比如啤酒、牛奶的时间和数量。最后将数据提交给APP的推荐业务。

在商场购物时,小明还看重了一款网球拍,但是没有加入扫描清单也没有购买。这时他或许不知道,就在他旁边的那个塑胶运动模特的脑袋里的摄像头记录下了他当下的一举一动,包括他的表情变化、在此停留的时间长短、试拍是右手握拍还是左手握拍等等一系列的细节。到了第二个月,小明手机的推送信息里就多了沃尔玛推荐的性价比更高的一款球拍。

有天,小明不想出门购物了。于是他打开沃尔玛的网上商场,cookie自动登录并显示自己上次登录的时间。在小明的购物首页推荐上有会员八折优惠的某款网球拍,还有一款全钢特价的西门子榨汁机。小明会心一笑:邻居王叔叔昨天在Twitter上抱怨自家的榨汁机真差劲时,小明顺手点了个赞。没想到沃尔玛就都知道了!随后小明又注意到自己在Facebook上唯一关注的某音乐人的新专辑已经发行售卖,这让小明很是心动。另外,自家附近的一家健身房的年卡正在打折出售,小明摸了摸肚子上的赘肉发出一声叹息,心想:沃尔玛你TM怎么知道这么多!

从这个小例子看出,通过大数据对数据的挖掘和利用,沃尔玛为自己的用户带来便利和个性化的用户体验,也为自己的运营带来了可观的销售增量。

 

Veracity

就是真实性。大数据中的内容是与真实世界中的发生息息相关的,要保证数据的准确性和可信赖度。研究大数据就是从庞大的网络数据中提取出能够解释和预测现实事件的过程。

其实这部分也在上面Value的部分已经有所体现。通过大数据的分析处理,最后能够解释结果和预测未来。但是前提是提取的数据要足够的准确性。沃尔玛通过大数据获取并分析用户提供的信息,可以知道用户独特的需求和喜好,并能够预测出用户下一步动作,并在用户行动前向用户推送信息。

 

 

 

你可能感兴趣的:(大数据5v指的是什么?——以沃尔玛为例)