大数据(一)大数据的相关理论

大数据(一)大数据的相关理论

目前人人都在谈大数据,但是,大数据是什么,每个人都有自己的一个看法。大数据这个概念,其实在上世纪九十年代就有人提出来了,当时希望通过将所有零散的数据归并起来,然后进行数据挖掘,以看到以前存在的问题,去预测未来几年的趋势,来指导商业决策。比如保险行业,人寿保险会通过大数据的统计计算,根据人均寿命来计算保费与回报率。这是在特定的环境,特定的时间下,对数据做一些商业化的尝试,还算不上真正的大数据。

想要系统认知大数据,必须要全面而细致的分解它,如果你听别人说大数据就是数据大,或者侃侃而谈 4 个 V,也许很有深度的谈到 BI 或预测的价值,又或者拿 Google 和 Amazon 举例,技术流可能会聊起 Hadoop 和 Cloud Computing,不管对错,只是无法勾勒对大数据的整体认识,不说是片面,但至少有些管窥蠡测、隔衣瘙痒了。下面从三个层面来展开认识:

大数据(一)大数据的相关理论_第1张图片

  • 第一层面是 理论,理论是认知的必经途径,也是被广泛认同和传播的基线。将会从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;从对大数据的现在和未来去洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。

  • 第二层面是 技术,技术是大数据价值体现的手段和前进的基石。将分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。

  • 第三层面是 实践,实践是大数据的最终价值体现。将分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。

大数据相关的理论

1. 特征定义

业界(IBM 最早定义)将大数据的特征归纳为 4 个“V”(量 Volume,多样
Variety,价值 Value,速 Velocity):第一,数据体量巨大。大数据的起始计量单位至少是 P(1000 个 T)、E(100 万个 T)或 Z(10 亿个 T);第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。第四,处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。

2. 价值探讨

大数据是什么?投资者眼里是金光闪闪的两个字:资产。比如,Facebook 上市时,评估机构评定的有效资产中大部分都是其社交网站上的数据。如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

Target 超市以 20 多种怀孕期间孕妇可能会购买的商品为基础,将所有用户的购买记录作为数据来源,通过构建模型分析购买者的行为相关性,能准确的推断出孕妇的具体临盆时间,这样 Target 的销售部门就可以有针对的在每个怀孕顾客的不同阶段寄送相应的产品优惠卷。

Target 的例子是一个很典型的案例,这样印证了维克托·迈尔-舍恩伯格提过的一个很有指导意义的观点:通过找出一个关联物并监控它,就可以预测未来。Target 通过监测购买者购买商品的时间和品种来准确预测顾客的孕期,这就是对数据的二次利用的典型案例。如果,我们通过采集驾驶员手机的 GPS 数据,就可以分析出当前哪些道路正在堵车,并可以及时发布道路交通提醒;通过采集汽车的 GPS 位置数据,就可以分析城市的哪些区域停车较多,这也代表该区域有着较为活跃的人群,这些分析数据适合卖给广告投放商。

从大数据的价值链条来分析,存在三种模式:

  • 手握大数据,但是没有利用好;典型的是金融机构,电信行业,政府机构等。
  • 没有数据,但是知道如何帮助有数据的人利用它;比较典型的是 IT 咨询和服务企业,比如,埃森哲,IBM,Oracle 等。
  • 既有数据,又有大数据思维;比较典型的是 Google,Amazon 等。未来在大数据领域最具有价值的两种事物:
  • 拥有大数据思维的人,这种人可以将大数据的潜在价值转化为实际利益;
  • 还未有被大数据触及过的业务领域。这些是还未被挖掘的油井,金矿,是所谓的蓝海。

3. 现在和未来

先看看大数据在当下有怎样的杰出表现:

大数据(一)大数据的相关理论_第2张图片

其实,这些还远远不够,未来大数据的身影应该无处不在。比如,Amazon 的最终期望是:“最成功的书籍推荐应该只有一本书,就是用户要买的下一本书。”Google 也希望当用户在搜索时,最好的体验是搜索结果只包含用户所需要的内容,而这并不需要用户给予 Google 太多的提示。

未来的大数据除了将更好的解决社会问题,商业营销问题,科学技术问题,还有一个可预见的趋势是以人为本的大数据方针。人才是地球的主宰,大部分的数据都与人类有关,要通过大数据解决人的问题。

比如,建立个人的数据中心,将每个人的日常生活习惯,身体体征,社会网络,知识能力,爱好性情,疾病嗜好,情绪波动……换言之就是记录人从出生那一刻起的每一分每一秒,将除了思维外的一切都储存下来,这些数据可以被充分的利用:

大数据(一)大数据的相关理论_第3张图片

4. 大数据隐私

用户隐私问题一直是大数据应用难以绕开的一个问题。在大数据的背景下,很多人都在积极的抵制无底线的数字化,这种大数据和个体之间的博弈还会一直继续下去……

当下,很多人依然没有建立对于信息隐私的保护意识,让自己一直处于被滋扰,被精心设计,被利用,被监视的处境中。

喜欢就点赞评论+关注吧

大数据(一)大数据的相关理论_第4张图片

感谢阅读,希望能帮助到大家,谢谢大家的支持!

你可能感兴趣的:(大数据开发常识)