什么是大数据?

什么是数据?

  凡是可以被电子化记录的都是数据。这不局限于数字,还包括语音输入的声音,数码相机拍下的照片,手机录制的视频等被电子化记录的内容等。

数据有什么用?

  数据之于个人的价值,一定关乎自身业务的核心诉求。只有说清楚了数据的商业价值,客户才容易为数据买单,数据企业才容易产生收入,数据产业中才不会有那么多的困惑。那么,数据的价值是什么呢?
我们可以从收入、支出、风险三个方面看待这个问题:

  • 收入。最典型的是百度付费搜索广告,它通过对用户搜索数据的深入分析,进行精准匹配,为广告主带去一大波流量,它所创造的收入增长就是数据的价值。
  • 支出。根据物联网技术采集到的信息,电视生产商发现某一款电视机的用户中,仅1%的用户还在使用老式的VGA视频接口。于是,他们决定取消这一接口设置,该决定为企业每年节省了上亿元成本。这也是数据分析带来的价值。
  • 风险。很多商业银行都有网上申请系统,风险普遍高于线下面签。数据分析可以帮助它们更加准确地区分哪些线上申请者是好人,哪些是坏人。这是以降低商业风险的方式,数据为公司所带来的间接价值。

什么是大数据?

  大数据,又称海量数据,指的是以不同形式存在于数据库、网络等媒介上蕴含丰富信息的规模巨大的数据。
大数据同过去海量数据有所区别,其基本特征可以用4个V来总结(Volume、Variety、Value和Velocity),具体含义为:

  • Volume,数据体量巨大,可以是TB级别,也可以是PB级别
  • Variety,数据类型繁多,如网络日志、视频、图片、地理位置信息等。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或承载的方式。
  • Value,价值密度低。以视频为例,连续不间断的监控过程中,可能有用的数据仅仅有一两秒。
  • Velocity,处理速度快,这一点与传统的数据挖掘技术有着本质的不同。
    简而言之,大数据的特点是体量大、多样性、价值密度低、速度快。

  时下,大数据这个概念很火,围绕这个概念,有两大技术分支,一个分支是关于大数据存储的,涉及关系数据库、云存储和分布式存储;另一个分支是关于大数据应用的,涉及数据管理、统计分析、数据挖掘、并行计算、分布式计算等内容。

你可能感兴趣的:(Hadoop)